M-JPEG
Bis zu diesem Punkt entsprechen die auf der vorherigen Codec-Seite beschriebenen Vorgänge dem Vorläufer von MPEG, dem sogenannten M-JPEG, bei dem jedes einzelne Filmbild also solches zwar datenreduziert wird, in seiner Abfolge aber alle Filmbilder auch abgespeichert werden.
M-JPEG war und ist insbesondere für Schnittsysteme interessant, weil hier jedes einzelne Filmbild direkt adressierbar ist.
Intraframe
Doch bleiben wir bei MPEG. Die einzelnen, bereits in ihrer Größe deutlich verkleinerten Bilder werden als Bildfolge, wie sie ein Videofilm nun einmal darstellt, noch einmal in ihrer Größe reduziert. Dabei kommen weitere Verfahren zum Einsatz, die im folgenden beschrieben werden.
Redundanzreduktion
Ein wichtiger Ansatz von MPEG, die Dateigrößen noch stärker zu reduzieren, besteht darin, dass von Einzelbild zu Einzelbild, identische Bildinformationen nur einmal abgespeichert werden sollen.
Wenn etwa hinter der Fernsehmoderatorin die ganze Zeit der gleiche unbewegte Studiohintergrund zu sehen ist, wird dieser quasi als Standbild abgespeichert und man hält nur die Veränderungen, also die sich bewegende Moderatorin fest.
Damit der Encoder sinnvoll arbeiten kann, versucht man, die Veränderungen in Form einer Bewegungseinschätzung vorherzusehen. Dabei wird die Ähnlichkeit von Blöcken von Bild zu Bild eingeschätzt.
Blockbasierte Bewegungsschätzung
Um eine möglichst wirksame Datenreduktion zu ermöglichen, wurde das sogenannte i-frame erdacht, ein vollständige JPEG Bild mit möglichst hoher Qualität. Auf ein solches I-Frame Bild folgen deutlich stärker komprimierte Bilder, die P-Frames (vorhergesagte) und die B-Frames (berechnete). So speichert MPEG im schlechtesten Fall nur ca. alle 16 Bilder ein vollständiges ab, dazwischen arbeitet es mit dem Speichern von Unterschieden und Schätzwerten. Entstehen Schätzungsfehler, so dauern die an, bis das nächste I-Frame Bild kommt. Sanftere Einstellungen setzen alle 9 Bilder einen I-Frame. Eine solche Ansammlung von Bildern wird "Group of Pictures" oder kurz GOP genannt und sie geht von jeweils einem I-Frame bis zum Nächsten.
Beim Beispiel unserer Fernsehmoderatorin ist dieses Verfahren auch noch denkbar, schließlich bewegt sich der ganze Studiohintergrund ja nicht. Schwieriger wird es da schon, wenn sich der gesamte Bildinhalt stark verändert, etwa bei einer Fahrt oder einem Schwenk. Hier greifen die Bewegungsvektoren.
Bewegungsvektoren
Ganz gleich ob Sport, Tanz, Schwenk, Zoom- oder tatsächliche Fahrt, bei Bewegungen kommen die meisten Codecs ins Schleudern, so auch MPEG. Man erkennt das an deutlicher Kästchenbildung in der Bereichen der stärksten Bewegung, während in den statischen Bereichen die Bildqualität einwandfrei scheint.
Wenn sich sämtliche Bildpunkte verändern, versucht MPEG herauszufinden, in welche Richtung und mit welcher Geschwindigkeit sich die Bildpunkte verschieben. Dabei wird das Bild in sogenannte Macroblöcke zerlegt und die Veränderung von Bild zu Bild erfasst. Bei MPEG-2 arbeitet man mit einer Genauigkeit von einem halben Pixel, beim Vorgänger MPEG 1 war es noch ein ganzes Pixel.
Der Vorgang läuft so ab: Im Encoder werden Differenzbilder erzeugt, bei denen nur der sich verändernde Inhalt abgespeichert wird. Alle anderen Bildteile werden nicht gespeichert, es sind übersprungene MAcroblöcke, an deren Stelle später im Decoder, also beim Betrachten des Filmes, die Informationen des I-Frames gesetzt werden.
MPEG-1 und MPEG-2
Während MPEG-1 relativ enge Rahmen vorschreibt, die maximale Bildauflösung begrenzt und auch für Audio nur Stereo ermöglicht, wurde 1994 mit MPEG-2 ein zukunftssicheres Format vorgestellt, welches auch 16:9 und höhere Auflösungen ermöglicht. Zudem können zu einem Videobild zahlreiche Audiospuren kodiert werden, eine wichtige Voraussetzung etwa für mehrsprachige DVDs und natürlich Dolby Surround.
Ferner sind eine frei wählbare Bildqualität, flexible Bitraten, und der frei wählbare Zugriff auf verschiedene Video-Kanäle (etwa um bei Aufnahmen von einem Ereignis diverse Kameraperspektiven frei auswählen zu können) wichtige Eigenschaften von MPEG-2.
Auf diese Weise sind diverse unterschiedliche Qualitätsstufen realisierbar. Insbesondere kann auf der Abspielseite entschieden werden, in welcher Qualität (abhängig vom verfügbaren System und dessen Recourcen) das Programm abgespielt werden soll.
Diese Variationsmöglichkeit nennt sich Scalability und eröffnet unterschiedliche Nutzungen auf der Anwenderseite mit nur einer feststehenden Kodierung. Im Gegensatz zu MPEG-1, welches als Farbraum 4:1:1 kennt, werden bei MPEG-2 auch 4:2:2 und 4:4:4 unterstützt, wodurch es auch in der professionellen Studiotechnik verwendet werden kann.
MPEG-2 kommt zum Beispiel auch bei dem bandgestützten HDV-Format zum Einsatz, die aus der Kompression resultierenden Artefakte werden insbesondere bei schnellen Bewegungen und Schwenks sichtbar.
Audio und MP3
Natürlich werden auch im Audio-Bereich massiv Daten reduziert. Denn auch hier vervielfacht die Digitalisierung analoger Audiosignale die notwendige Datenmenge. Geht man etwa von der Qualität einer DAT aus, also einer Abtastfrequenz von 48 kHz und einer Quantisierung von 16 Bit kommt man bei 2 Kanälen (Stereo) auf eine Datenrate von 2x768 kbit/s, also ca. 1,5 Mbit/s.
Diese lässt die Audio-Komprimierung von MPEG auf ca. 384 kbit/s schrumpfen. Theoretisch kann man sie sogar auf niedrigere Raten senken, doch das Ergebnis unterhalb von etwa 112 kbit/s ist eher unerfreulich. Eine der möglichen Varianten des ebenfalls skalierbaren Audio-Teils von MPEG-1 ist der Audio Layer 3- besser bekannt als MP3. In dieser Variante ist der Codec auf beinahe allen mobilen Playern vorhanden und erzielt bei 128 Kbit/s das beste Kompressions/Qualitätsverhältnis..
Fazit
Bei der Kodierung vom MPEG ist ein deutlich höherer Rechenaufwand notwendig als beim Abspielen. Es gibt innerhalb der Standards viele Varianten, so kann man von Standard bis HD viele Formate im Codec unterbringen. Dies geschieht in Form von Levels, unterschieden in Low (352x240), Main (720x480), High-1440 (1440x1152) und High (1920x1080).
Die richtigen Einstellungen beim Kodieren zu finden, um nicht die gefürchteten Blöcke und Pixelfehler in einem Film zu haben, sind eine Wissenschaft für sich. Sie sind nicht zuletzt abhängig vom Medium, auf welches man speichern möchte. Moderne DVD Programme berechnen den günstigsten Kompressionsgrad für die jeweils verwendete DVD (Normal oder Double-Layer) und die Filmlänge selbsttätig.
Über den Umstand, dass man bei den meisten Consumer-Varianten bis dahin aber jede Menge Bildinformationen verloren hat, können auch die schönsten DVD-Cover nicht hinwegtäuschen. Fortschritte in Sachen Bildqualität brachte erst BluRay.