Płynniejsze wideo dzięki przełomowym technologiom: Konwersja I/P w monitorach LCD

Opublikowano: Listopad 30, 2012

Jest powszechnie wiadome, że monitory LCD były początkowo źle przystosowane do wyświetlania obrazów ruchomych. To taka ciekawostka z przeszłości. Ostatecznie jednak monitory LCD osiągnęły ugruntowaną pozycję jako podstawowe urządzenia wyświetlające, a w oparciu o różnorodne nowe technologie związane z jakością wyświetlania, jakie pojawiły się w ostatnich latach, znacząco poprawiła się jakość odtwarzania przez nie obrazów wideo. Tym razem na naszych łamach skupimy się na procesie konwersji materiału wideo z przeplotem na wideo bez przeplotu (ang. – interlace-to-progressive, w skrócie I/P) lub inaczej usuwaniem przeplotu (ang. – deinterlacing), którego zadaniem jest umożliwienie płynnego odtwarzania wideo na monitorach LCD i telewizorach. To bardzo istotna technologia, szczególnie dla osób, które często oglądają filmy na swoich monitorach.

* Uwaga: Poniższy tekst jest tłumaczeniem z japońskiego, artykułu zamieszczonego w ITmedia „Płynniejsze wideo dzięki przełomowym technologiom: Konwersja I/P w monitorach LCD” („Smoother video with cutting-edge technologies: LCD monitor interlace-to-progressive (I/P) conversion”) opublikowanego 29 czerwca 2009r. Copyright 2011 ITmedia Inc. All Rights Reserved.

Linie skanowania (wybierania) i metody tworzenia obrazu na ekranie

Proces konwertowania sygnałów wideo zawierających przeplot na progresywne sygnały wideo (bez przeplotu) jest nazywany usuwaniem przeplotu (ang. – interlace-to-progressive (I/P) conversion), deinterlacingiem lub po prostu konwersją I/P. Termin konwersja I/P obejmuje różne metody i poziomy technologiczne. Kompletność technologii konwersji ma istotny wpływ na jakość obrazu na monitorze lub telewizorze LCD. Przed rozpoczęciem jakiejkolwiek dyskusji na temat konwersji I/P, będziemy potrzebowali odrobiny podstawowej wiedzy na ten temat. Skupmy się na liniach skanowania wideo i metodach skanowania.

Jak większość z nas wie, filmy są wyświetlane na monitorze, pokazując po kolei serię następujących po sobie klatek składających się na film, wg. tej samej koncepcji, na jakiej opiera się flip book.  Pojedyncza klatka filmowa jest podzielona poziomo na cienkie linie i są one wyświetlane na ekranie od góry do dołu. Pojedynczą linię tworzącą obraz wideo nazywa się linią skanowania lub linią obrazu. Przyglądając się takiej linii jeszcze dokładniej, można zauważyć, że pojedyncza linia jest tworzona przez maleńki, szybko poruszających się punkt świetlny.

Zasada działania ekranu korzystającego z linii skanowania

Standardowej rozdzielczości obraz wideo w systemie NTSC, tradycyjnie wykorzystywanym do analogowego przekazu telewizyjnego, ma 525 linii skanowania (480 efektywnych linii skanowania) na klatkę. Nadawany cyfrowo obraz wideo wysokiej rozdzielczości ma 1125 linii (1080 efektywnych linii skanowania). Innymi słowy, wideo standardowej rozdzielczości jest podzielone poziomo na 525 części, podczas gdy wideo wysokiej rozdzielczości jest podzielone na 1125 części. Oczywiście wideo HD, posiadając więcej linii skanowania, zapewnia wyraźniejszy obraz.

Współczesne urządzenia wyświetlające, rozpoczynają rysowanie pierwszej linii skanowania u góry ekranu z lewej do prawej. Tak samo jest tworzona druga linia skanowania, a następnie trzecia i kolejne linie. W ten sposób obraz jest podzielony na linie od góry do dołu wyświetlane po jednej na raz. Do tworzenia obrazu z wykorzystaniem linii skanowania wykorzystywane są dwie metody – z przeplotem i progresywna (bez przeplotu). Metody te różnią się między sobą kolejnością, w jakiej wyświetlane są linie skanowania. Nawiasem mówiąc, w nie tak odległej przeszłości metoda „bez przeplotu” była używana przede wszystkim w przemyśle komputerowym. Określenia „bez przeplotu” i „progresywnie” są w zasadzie równoznaczne, ale termin „progresywnie” jest obecnie bardziej powszechnie używany.

Metoda z przeplotem

Najprościej rzecz ujmując, w metodzie z przeplotem pojedyncza klatka wideo jest przesyłane po podzieleniu na dwa półpola. Pole wykorzystywane do przekazywania nieparzystych linii skanowania (1, 3, 5, …) nazywa się półpolem nieparzystym (ang. – odd). Pole używane do transmisji parzystych linie skanowania (0, 2, 4, …) nazywa się półpolem parzystym (ang. – even). Parzyste i nieparzyste półpola są przekazywane na zmianę i są wyświetlane na urządzeniu wyświetlającym naprzemiennie. Innymi słowy, para półpól, nieparzystego i parzystego, składa się na jedną klatkę wideo. W standardzie NTSC szybkość przesyłania jednego półpóla wynosi 1/60 sekundy. Oznacza to, że w ciągu sekundy jest wyświetlanych 60 półpól (30 klatek) nieruchomych obrazów – czyli tak szybko, że ludzkie oko postrzega to jako ruchomy obraz.

(Od tłumacza: W przypadku systemu PAL, używanego w naszym obszarze, czas trwania jednego półpola wynosi 1/50 sekundy. Tak więc na jedną sekundę wideo składa się 50 półpól, tworzących 25 klatek).

Pierwotnie, technologia przeplotu była wykorzystywana do podniesienia rozdzielczości obrazu przez podniesienie częstotliwości tworzenia obrazu na ekranie przy jednoczesnej minimalizacji objętości przesyłanych danych. Ponieważ system ten został opracowany z myślą o telewizorach kineskopowych, które wyświetlają obrazy poprzez wysyłanie wiązki elektronów, to w zasadzie słabo nadaje się do zastosowania w monitorach i telewizorach LCD, które mogą wyświetlić na ekranie od razu wszystkie piksele na raz. Aktualne metoda ta jest wykorzystywana do prowadzenia transmisji telewizyjnych, zapisie filmów na DVD i w innych zastosowaniach wideo.

Obraz wyświetlany z przeplotem. Cała klatka obrazu powstaje przez połączenie dwóch półpól.

Metoda progresywna

Dla odmiany w metodzie progresywnej obraz dane obrazu są przekazywane i wyświetlane od pierwszej do ostatniej linii skanowania, w kolejności od góry do dołu. W przeciwieństwie do metody z przeplotem, umożliwia ona wyświetlenie całej klatki na raz, bez dzielenia jej na dwa półpola. Wymaga to jednak większej przepustowości podczas przekazywania sygnału niż w metodzie z przeplotem. Powodowała jednak problemy ze zgodnością z odbiornikami TV, pracującymi w tradycyjnym systemie NTSC (od tłumacza: i PAL również). Z tego powodu metoda progresywna nie był używana przez dłuższy okres czasu. (obecnie satelity przekaźnikowe i komunikacyjne wielu krajów już prowadzą transmisję cyfrowej telewizji z wykorzystaniem tej metody). Dla monitorów komputerowych metoda progresywna była podstawową od samego początku, jeszcze w latach 90, erze monitorów CRT (kineskopowych). Biorąc pod uwagę charakter ekranów komputerowych – wyświetlanie głównie niezmiennych pikseli – metoda progresywna idealnie nadaje się do wykorzystania w monitorach i telewizorach LCD.

Obraz wyświetlany progresywnie. W przeciwieństwie do metody z przeplotem, cały obraz jest wyświetlany bez podziału pojedynczej klatki na dwa półpola.

Metoda z przeplotem tworzy obraz poprzez naprzemienne wyświetlanie dwóch niepełnych półpól, czyniąc go podatnym na migotanie i rozmycie. Niedoskonałość ta może być szczególnie widoczna na dużych ekranach. W progresywnej metodzie klatka jest wyświetlana jako jeden pełny obraz i osiąga znakomitą jakość, minimalizując migotanie i rozmycie. Częściowo z tego powodu, produkty wykorzystujące tą metodę stały się obecnie powszechnie wykorzystywane, i to już od wielu lat, jako ekrany komputerowe, które są często używane do wyświetlenia obrazów o wysokiej rozdzielczości.

Konwersja I/P: Niezbędna do oglądania materiałów wideo na monitorze LCD

Dostępne obecnie na rynku monitory i telewizory LCD są zaprojektowane z myślą o wyświetlaniu progresywnych materiałów wideo. Jednak większość treści wideo, w tym nadawanych analogowo programów telewizyjnych, filmów na DVD oraz naziemnych transmisji telewizyjnych nadawanych w rozdzielczości 1080i, wykorzystuje przeplot. Z tego powodu, urządzenie wyświetlające musi dokonać konwersji materiału z przeplotem na progresywny. Tym sposobem doszliśmy do naszego głównego zagadnienia: konwersji I/P. Większość telewizorów i monitorów LCD obecnie posiada wbudowane układy konwersji I/P. Chociaż technologia ta po raz pierwszy pojawiła się w wyświetlaczach, to ostatnio bardzo powiększyła się liczba urządzeń odtwarzających z technologią I/P. Na przykład urządzenia odtwarzające wyposażone w wyjścia sygnału progresywnego i powiększające obraz odtwarzany z DVD (domowe odtwarzacze i nagrywarki DVD, Blu-ray, czy PlayStation 3) posiadają układy konwersji I/P. Tak na marginesie, proste uzupełnienie luk w sygnale z przeplotem może czasem spowodować nienaturalny wygląd i przeszkodzić w uzyskaniu wysokiej jakości obrazu, nawet po konwersji na tryb progresywny. Należy pamiętać, że systemy stosowane do konwersji I/P mogą się znacznie różnić dokładnością między sobą.

Dwie metody konwersji I/P

Konwersję I/P można przeprowadzić na dwa podstawowe sposoby. Pierwszym jest konwersja adaptacyjna ruchu (ang. – motion-adaptive conversion). Drugim sposobem jest konwersja metodą „pomijania 2-3” (ang. – 2-3 pull-down). Te dwa systemy konwersji I/P bardzo się między sobą różnią. To bardzo ważne, aby wybrać właściwy sposób konwersji, w zależności od rodzaju materiału źródłowego do wyświetlenia. Nie da się jednoznacznie określić, czy któraś z nich jest wyraźnie lepsza. Urządzenia odtwarzające i wyświetlające wybierają optymalną metodę konwersji automatycznie (Czasami można również wykonać ręcznego wyboru).

Konwersja I/P z adaptacją ruchu (Motion-adaptive I/P conversion)

Najprostszą metodą konwersji I/P jest łączenie parzystych i nieparzystych półpól sygnału wideo z przeplotem, aby utworzyć pełną klatkę (międzypolowe uzupełnianie – inter-field suplementation). O ile  pozwala ona na konwersję nieruchomych obrazów do formatu progresywnego z wyższą czystością, to sprawa ma się zupełnie inaczej w przypadku obrazów wideo.

Z powodu przesunięcia ruchomych obiektów pomiędzy nieparzystymi i parzystymi półpolami, zwykłe połączenie ich spowoduje, że krawędzie obiektów będą postrzępione i zaszumione. Choć odstęp czasowy pomiędzy półpolami to tylko 1/60 sekundy (przyp. tłum. – w systemie PAL jest to 1/50 sekundy), to w kontekście płynnego odtwarzania wideo jest to różnica znacząca. Jeśli poddawanym konwersji I/P źródłem jest ruchome wideo, to w zależności od pomiaru, linia wynikowa może powstawać wprost z linii nieparzystej lub parzystej oryginału (wewnątrz-polowe uzupełnianie – inner-field suplementation) lub poprzez zmieszanie ich ze sobą, redukując w ten sposób postrzępione krawędzie w powstającej klatce obrazu (między-polowe uzupełnianie – inter-field suplementation). Metoda ta jest nazywana konwersją z adaptacją ruchu lub selektywnym mieszaniem.

Niska dokładność konwersji I/P może doprowadzić do postrzępionych krawędzi, tak jak to widać powyżej w miejscach oznaczonych strzałkami (fotografia po lewej). Podczas prawidłowej konwersji I/P takie miejsca są wygładzane (fotografia po prawej).

W rzeczywistości, to czy poddawany konwersji I/P materiał jest obrazem ruchomym czy nie, jest określane automatycznie. Uzupełnianie wewnątrz-polowe (inner-field suplementation) jest stosowane w stosunku do obrazów nieruchomych (lub zawierających bardzo niewiele ruchu). Natomiast w stosunku do obrazów ruchomych stosowane jest uzupełnianie między-polowe (inter-field suplementation). Materiał wideo bardzo rzadko składa się tylko ze stopklatek czy obrazów z niewielką ilością ruchu. W związku z tym, stosując samo tylko wewnątrz-polowe uzupełnianie trudno uzyskać wysokiej jakości klatki. Problemem, który może się pojawić to nieprawidłowe rozpoznanie czy konwertowany obraz jest ruchomy, czy nie. Powoduje to degradację jakości obrazu po konwersji I/P oraz nienaturalne ruchy.

W ostatnich latach wydajność konwersji I/P z adaptacją ruchu jest stopniowo udoskonalana. Postęp ten osiągnięto dzięki zwiększonej dokładności rozpoznawania charakteru ruchomych obrazów, będącego podstawą do zastosowania wewnątrz- lub zewnątrz-polowego uzupełniania. Na tym polu każdy producent prezentuje własne doświadczenie i umiejętności.

Konwersja I/P metodą 2-3 pull-down (pomijanie 2-3)

Spójrzmy teraz na konwersję I/P metodą 2-3 (zapisywane również jako 2:3) pull-down. Stosuje się ją podczas konwersji I/P źródłowych materiałów wideo o klatkażu 24 kl./s (klatek na sekundę, ang. fps – frames per second). Podstawowymi przykładami takich materiałów są filmy kinowe i animowane. Ponieważ dzisiejsze telewizory i monitory LCD są przystosowane do przyjmowania materiałów o klatkażu 30 kl./s lub 60 kl./s, to aby mogły wyświetlić materiały o 24 kl./s należy jakoś uzupełnić brakujące klatki.

W konwersji I/P 2-3 pull-down najpierw z pierwszej klatki generuje się dwa półpola, z drugiej klatki trzy półpola, z trzeciej – 2, z czwartej – 3 itd. w ten sam sposób, a następnie stosuje się uzupełnianie między półpolami, aby ponownie przekonwertować wideo do formatu progresywnego.

O ile wydaje się, że ta metoda powinna być doskonała, to w praktyce można natknąć się na trudność w określeniu czy źródłowy materiał wideo ma klatkaż 24 kl./s. Omyłkowe zastosowanie metody 2-3 pull-down w odniesieniu do materiału o klatkażu 30 kl./s może spowodować, że obraz wideo będzie się regularnie zacinał z powodu uzupełniania go dodatkowymi klatkami. Najnowsze rozwiązania znacząco poprawiły dokładność rozróżniania materiałów 24 kl./s i 30 kl./s.

Co więcej, konwersja metodą 2-3 pull-down nie jest ściśle zgodna z monitorami i telewizorami LCD. Ponieważ ich częstotliwość odświeżania wynosi 60 Hz (szybkość z jaką są generowane wszystkie linie pojedynczego obrazu), to jego klatkaż również wynosi 60  kl./s (lub 60 półpól na sekundę). Podczas wyświetlania wideo przekonwertowanego metodą 2-3 pull-down, klatki wyświetlane przez czas równy 2/60 lub 3/60 sekundy mogą być przemieszane ze sobą, powodując szarpane, niepłynne odtwarzanie.

Z tego powodu niektóre nowsze monitory i telewizory LCD posiadają funkcję wyświetlania 24 klatkowego wideo płynnie bez konwersji 2-3 pull-down. Jednym z przykładów jest panoramiczny monitor LCD firmy Eizo Nanao – Foris FX2431, wyposażony w zestaw wejść wideo i audio. Może on wyświetlać bezpośrednio materiały wideo 1080/24p. Jest wyposażony w system wyświetlania umożliwiający uzyskanie częstotliwości 48 Hz, konwertuje on wideo o 24 kl./s podwajając jego klatkaż do 48 kl./s, a następnie wyświetla każdą klatkę źródłową przez 2/48 części sekundy. Dzięki temu, ponieważ każda klatka jest wyświetlana przez taką samą długość czasu, ruch wygląda na bardziej naturalny.

Oczywiście do wyświetlania wideo w formacie 1080/24p na monitorze Foris FX2431, potrzebne jest również źródło wideo podające na wyjściu sygnał o 24 kl./s. Ale to nie stanowi obecnie problemu, ponieważ wiele współczesnych odtwarzaczy Blu-ray i nagrywarek posiada taką funkcję. Nawet PlayStation 3 może wypuścić sygnał wideo i klatkażu 24 kl./s.

Różnica pomiędzy konwersją I/P metodą 2-3 pull-down (u góry) oraz konwersją I/P 1080/24p I/P (u dołu). Ponieważ dzięki konwersji 1080/24p wideo o 24 kl./s jest wyświetlane w dokładnie takim samym klatkażu, to sceny, w których przy zastosowaniu metody 2-3 pull-down byłyby odtwarzane w poszarpany sposób, będą wyglądały płynnie.