Słowo wstępne
Kodek HDX4 jest
komercyjną implementacją standardu MPEG-4 Part 2 (ISO/IEC
#14496-2). Okres użytkowania wersji próbnej jest ograniczony do
60 dni. Kodek posiada prawie wszystkie funkcje MPEG-4 Advanced
Simple Profile (kwantyzacja typu MPEG, Quarterpel,
klatki typu B, możliwość zachowania przeplotu) oraz
umożliwia kompresję zgodnie z profilami HDX4 (zachowującymi
zgodność z odpowiednimi profilami DivX
Networks), co z
pewnością docenią osoby kompresujące filmy z przeznaczeniem
dla odtwarzaczy stacjonarnych. W pakiecie znajduje się dekoder DirectShow
służący do odtwarzania plików MPEG-4 oraz kompresory
dla architektur Video for Windows (używanej między
innymi przez programy z rodziny VirtualDub) i DirectShow
(do zastosowania np. w programie GraphEdit).
Opcje ogólne
1. Help... - wywołuje plik pomocy w języku
angielskim.
2. Load defaults - przywraca domyślne
ustawienia kodeka.
3. Language - wybór języka interfejsu
graficznego. Niniejszy artykuł używa nazewnictwa angielskiego,
lecz do wyboru mamy jeszcze niemiecki i francuski.
I - zakładka Interoperability

Opcje umieszczone w tej zakładce kontrolują zgodność pliku
wynikowego z poszczególnymi profilami HDX4. . Poniższa
tabela zawiera parametry poszczególnych profili.
Profil
|
Maks.
rozdzielczość / FPS
|
Maksymalny bitrate
(kbps)
|
Handheld
|
176x144 @ 15fps
|
128
|
Portable
|
352x240 @ 30fps
352x288 @ 25fps
|
768
|
Home Theater
|
720x480 @ 30fps
720x576 @ 25fps
|
4000
|
High
Definition
|
1280x720 @ 30fps
|
8000
|
1. Profile - wybór profilu HDX4.
Poszczególne profile ograniczają dostęp do funkcji kodeka (takich
jak np. poszczególne rodzaje klatek i Quarterpel) oraz
rozdzielczości, ilości klatek na sekundę i bitrate, co
ma zapewnić zgodność z dekoderami posiadającymi certyfikaty HDX4
dla danego profilu. Profile te nakładają ograniczenia na bitrate,
ponieważ wprowadzono do niej mechanizm VBV (Video
Buffer Verifier). Jeśli nie zamierzamy korzystać z
dekoderów sprzętowych, możemy odznaczyć Profile.
2. MPEG quantization - użycie kwantyzacji
typu MPEG zamiast H.263. H.263 wygładza
obraz i nadaje się do kompresji z niskim bitrate, podczas
gdy MPEG zachowuje ostrość obrazu przy wysokim bitrate.
Użycie tej opcji może spowodować niezgodność pliku
wynikowego z niektórymi istniejącymi dekoderami sprzętowymi
obecnymi w popularnych odtwarzaczach stacjonarnych (dotyczy to
wielu spośród odtwarzaczy certyfikowanych przez DivX
Networks).
3. Quarterpel znajduje i opisuje wektory
ruchu z dokładnością do 1/4 piksela, co pomaga w lepszym
odwzorowaniu ruchu. Wyższa precyzja wektorów wymaga zużycia
większej ilości bitów do ich zapisu, natomiast nie można
przewidzieć, czy ta strata zostanie wyrównana dzięki
zmniejszeniu objętości informacji o teksturze obrazu. Użycie
tej opcji zauważalnie spowalnia kompresję i może spowodować
niezgodność pliku wynikowego z niektórymi istniejącymi
dekoderami sprzętowymi obecnymi w popularnych odtwarzaczach
stacjonarnych (dotyczy to wielu spośród odtwarzaczy
certyfikowanych przez DivX Networks).
4. Is input interlaced - opcje tą
zaznaczamy, gdy w materiale źródłowym występuje przeplot.
Należy pamiętać, że jej użycie ma sens tylko, gdy
źródło zawiera przeplot a jego rozdzielczość pionowa nie
była zmieniana. Opcję Top field first wybieramy, gdy
półobraz górny wyprzedza dolny w czasie. Gdy wcześniejszą
pozycję w czasie ma półobraz dolny, wybieramy Bottom field
first. Musimy też wybrać jeden z dwóch sposobów
postępowania z przeplotem: De-interlace - usunięcie
przeplotu przed kompresją. Uzyskany w ten sposób materiał jest
kompresowany jako progresywny. Zalecane gdy chcemy odtwarzać
film na ekranie progresywnym (np. monitorze komputera) i nie
używamy filtrów usuwających przeplot poza kodekiem (w
programie kompresującym). Encode as interlaced -
kompresja z zachowaniem przeplotu. Należy zaznaczyć, że
kompresja z przeplotem wymaga zastosowania większego bitrate i
jest celowa tylko w przypadku, gdy zamierzamy odtwarzać
materiał wyjściowy na ekranie odświeżającym obraz z
przeplotem (np. telewizor) oraz materiał źródłowy zawiera
przeplot (np. programy kręcone dla telewizji lub materiał z
kamery DV). Opcja Top field first wymusza zapis górnego
półobrazu danej klatki przed dolnym, w przeciwnym wypadku dolny
półobraz jest zapisywany jako pierwszy. Niezgodne z profilami Handheld
oraz Portable.
5. B-frames - klatki typu B, czyli
odwołujące się zarówno do poprzedniej, jak i do następnej
klatki. Dzięki posiadaniu dwóch klatek referencyjnych oraz temu,
że żadna klatka nie odwołuje się do klatki typu B,
klatka taka może wyglądać równie dobrze, jak klatka typu P
pomimo wyższego kwantyzatora. W ten sposób użycie klatek typu B
może oszczędzić wiele bitów. Suwakiem Max consecutive B-frames
określamy maksymalną ilość klatek typu B, które mogą
następować po sobie (nie zaleca się stosowania wartości
większych, niż 3). Warto wiedzieć, że kodek zawsze
używa packed bitstream, czyli wynalezionego przez DivX
Networks sposobu zapisu klatek typu B w kontenerze
*.avi.
6. Custom FourCC identifier - znacznik FourCC
(ang. four character code), który zostanie umieszczony w
pliku wynikowym. Słuzy on do identyfikacji kodeka, którego
użyto do kompresji. Zalecane jest pozostawienie DX50 dla
zgodności z odtwarzaczami stacjonarnymi. Po odznaczeniu tej
opcji zostanie użyty znacznik HDX4.
II - zakładka Rate control

1. Rate mode - wybór trybu kompresji.
Single Pass - kompresja jednoprzebiegowa. Zlokalizowanym
poniżej przyciskiem wybieramy jeden z trzech rodzajów kompresji
jednoprzebiegowej - Target bitrate (Kbps), Quality
lub Quantizer. Pierwszy z nich (Target bitrate (Kbps))
kompresuje film ze stałym bitrate, przez co rozmiar pliku
wynikowego można przewidzieć. Ponieważ jednak poszczególne
sceny filmu różnią się od siebie złożonością oraz
ilością ruchu (przez co każda z nich wymaga innego bitrate),
nie jest on polecany - bitrate może się okazać zbyt
niski bardziej wymagających scen. Tryby drugi i trzeci (Quality
i Quantizer) kompresują film ze stałym kwantyzatorem,
dzieki czemu każda scena otrzyma ilość bitów odpowiednią do
swoich potrzeb. Mankamentem tego rodzaju kompresji
jednoprzebiegowej jest całkowita nieprzewidywalność rozmiaru
pliku wynikowego.
W polu tekstowym po prawej stronie przycisku Target bitrate (Kbps)/Quality/Quantizer
podajemy odpowiednią wartość bitrate (w kilobitach na
sekundę), jakość (w procentach) lub kwantyzator (jeśli podana
wartość nie jest liczbą całkowitą, np. 2.75, to
rozkład kwantyzatorów będzie miał postać ciągu 2, 3,
3, 3, 2, 3, 3, 3,...).
Możemy ją też określić posługując się suwakiem. Kompresja
jednoprzebiegowa ze stałym bitrate powoduje
nieekonomiczne wykorzystanie dostępnych bitów, więc gdy
zależy nam tylko na osiągnięciu średniego (a nie
stałego) bitrate na przestrzeni całego filmu, zalecana
jest kompresja dwuprzebiegowa.
Two-pass - 1st pass - pierwszy przebieg kompresji
dwuprzebiegowej. Służy on do analizy materiału źródłowego
pod kątem kompresowalności każdej klatki. Informacje te są
zapisywane do pliku statystyk, którego lokalizację określamy w
polu Two pass filename. Zaznaczenie Discard first-pass
powoduje, że podczas pierwszego przebiegu nie jest tworzony plik
wideo. Opcja ta jest użyteczna, ponieważ plik wideo tworzony
przez pierwszy przebieg może być niezgodny ze standardem MPEG-4
lub nawet niezdatny do użytku.
Two-pass - 2nd pass - drugi przebieg kompresji
dwuprzebiegowej. Korzysta on z pliku statystyk zapisanego podczas
pierwszego przebiegu (co daje mu całościowe spojrzenie na
materiał źródłowy) aby optymalnie rozłożyć dostępne bity
w całym pliku wynikowym. W pole tekstowe Target bitrate (Kbps)
należy wpisać stosowną wartość bitrate lub wybrać
ją przy pomocy suwaka.
III - zakładka Pre-processing

1. Crop - obcinanie brzegów obrazu.
Wybieramy ilość pikseli do obcięcia odpowiednio z lewej (Left),
z góry (Top), z prawej (Right) i z dołu (Bottom).
Obcięcie brzegów zalecane jest gdy zawierają one czarne pasy (umieszczone
tam np. w celu dostosowania panoramicznego filmu kinowego do
telewizyjnych proporcji 4:3 czyli tzw. letterboxing),
ponieważ kompresja obszaru granicznego (tam gdzie brzeg obrazu
styka się z czarnym pasem) zużywa bardzo wiele bitów na
dokładne odwzorowanie brzegu.
2. Resize - zmiana rozdzielczości obrazu.
Następuje po obcięciu brzegów (jeśli je stosujemy).
Zmniejszenie rozdzielczości obrazu umożliwia skompresowanie go
z niższym bitrate oraz płynne odtworzenie go na
komputerze o słabszy procesorze lub przy pomocy słabszego
dekodera sprzętowego.
Na liście Method mamy do wyboru mamy jedną z trzech
metod:
Soft - metoda dająca dosyć nieostry, lecz kompresowalny
rezultat. Normal - kompromis pomiędzy kompresowalnością
a ostrością obrazu. Sharp - najostrzejszy i najmniej
kompresowalny obraz.
W polach Resolution podajemy docelową rozdzielczość (szerokość
x wysokość).
3. Pixel Aspect Ratio - proporcje piksela.
Zarówno płyty VCD, jak i DVD używają pikseli, które nie są
kwadratowe, więc jeśli chcemy zachować pełną rozdzielczość
takiego źródła (ewentualnie tylko obciąć czarne pasy),
wybieramy z listy rozwijanej pozycję odpowiednią do systemu
telewizyjnego naszego źródła (PAL lub NTSC) oraz
do jego anamorfizmu (16:9 dla anamorficznej płyty DVD, 4:3
dla nieanamorficznej). Jeśli materiał źródłowy używa
kwadratowych pikseli lub przywróciliśmy prawidłowy stosunek
boków filmu zmieniając jego rozdzielczość, to pozostawiamy
opcję Pixel Aspect Ratio odznaczoną. Dla materiałów
źródłowych o nietypowym stosunku boków piksela możemy
wybrać User defined i określić ten stosunek "ręcznie"
wpisując odpowiednie wartości w pola X (szerokość
piksela) oraz Y (wysokość piksela). Należy pamiętać,
że nie wszystkie odtwarzacze stacjonarne obsługują
anamorficzne filmy MPEG-4.
4. Pre-filter source - przetwarzanie obrazu
przed kompresją. W chwili obecnej dostępne jest tylko
ustawienie Soften, które przeznaczone jest do usunięcia
szumu i innych zakłóceń z obrazu oraz polepszenia jego
kompresowalności.
IV - zakładka Motion

1. Quality - precyzja poszukiwania ruchu.
Ustawienie Real-time automatycznie dobiera opcje kompresji
dostosowując je do możliwości naszego komputera. Zalecane
ustawienie to Highest.
2. Psychovisual enhancement - wykorzystanie
podczas kompresji modelowania psychowizualnego, czyli
zwiększenie kompresji w obszarach, w których ludzki wzrok tego
nie dostrzeże. Ustawienie Off wyłącza modelowanie
psychowizualne, kolejne ustawienia (Low, Balanced, High
i Ultra) zwiększają intensywność zastosowania
modelowania psychowizualnego. Wykorzystanie tej funkcji jest
zalecane jedynie przy niskich bitrate.
3. Max key frame interval - maksymalna
dozwolona ilość klatek delta (tzn. klatek typów
różnych od I) pomiędzy dwoma klatkami typu I.
Zalecana wartość to 10*FPS, gdzie FPS to ilość klatek na
sekundę w materiale źródłowym. Należy wiedzieć, że kodek
wstawia klatki typu I również wtedy, gdy wykryje zmianę
sceny - jest to najkorzystniejsze dla kompresji.
4. Optimize for film source - funkcja
polepszająca opis "ziarna" występującego w filmach
kinowych.
Artykuł dostępny jest również w formie dokumentu PDF
Aby ściągnąć plik skorzystaj z menu kontekstowego myszy i opcji Zapisz element docelowy jako... |