Prezentacje projektów – Potrzeba szybkiego odnalezienia odcinka wideo?
Rozgłośnie posiadają tysiące godzin nieprzetworzonych odcinków wideo zarchiwizowanych w swoich bazach danych. Wiele z tych, gorączkowo potrzebnych odcinków, można zastosować do przyszłych programów, ale często się zdarza, że przechowywane są one, pokrywając się wirtualnym kurzem, ponieważ producenci programów i dziennikarze — pracujący zazwyczaj z krótkimi terminami — nie są w stanie szybko ocenić ich zawartości. "Producenci programów mogą chcieć wykorzystać jedynie kilka sekund lub minut, trwającego godziny materiału, jaki nakręcili," mówi Dr Oliver Schreer z Fraunhofer Institute for Telecommunications/Heinrich-Hertz-Institute w Berlinie. "W okresie obecnym, rozgłośnie mogą opatrywać nieedytowany materiał pewnymi ręcznymi adnotacjami, ale jest procedura zabierająca wiele czasu, a większość materiału pozostaje niesklasyfikowana, a więc niewykorzystana," mówi dalej Dr Schreer. "W rzeczywistości potrzebują one zautomatyzowanych metod organizacji materiału filmowego." Uczestnicząc w ramach projektu pod nazwą "Wyszukiwanie semantycznych jednostek multimedialnych do ponownego, szerszego wykorzystania" (Rushes), Dr Schreer kierował zespołem z europejskich instytutów naukowych oraz z przemysłu, podczas pracy nad sposobami ponownego, dużo łatwiejszego wykorzystania tego typu nieedytowanych zawartości materiału wideo. Opracowany, prototypowy system umożliwia automatyczną analizę, oraz opatrywanie etykietami odcinków materiału wideo, co pozwala na znacznie łatwiejsze indeksowanie i katalogowanie. W międzyczasie zespół stworzył także interfejs użytkownika w celu poprawy sposobu zarządzania i wyszukiwania materiału w dużych archiwach multimedialnych. "Przechowywane obecnie bazy danych wideo są w stanie prezentować indywidualne obrazy z materiałów wideo, ale użytkownik posiada ograniczone możliwości zrozumienia i analizy takich materiałów. Chcieliśmy stworzyć narzędzia, które mogą zaprezentować treść materiału wideo w znacznie lepszy sposób," mówi Dr Schreer. Rozwój współpracy W okresie opracowywania systemu, w zespole projektowym zaangażowano zawodowych i zwykłych użytkowników. Pierwszym krokiem było oszacowanie przepływów prac i technologii, stosowanych obecnie w tym sektorze przemysłu, przy jednoczesnym rozpoznaniu obszarów wymagających poprawy oraz dodatkowych potrzeb. "W celu stworzenia prototypu współpracowaliśmy z rozgłośnią Basque ETB," mówi Dr Schreer. Po zaprojektowaniu systemu, użytkownik przetestował go i zweryfikował. "Prosiliśmy dziennikarzy i archiwistów o zbadanie rozmaitych funkcji systemu," dodaje on. "Takie opinie były dla nas istotne, ponieważ na prawdę chcieliśmy zapewnić rozwiązanie, które zaspokoi potrzeby tego sektora przemysłu." System umożliwia analizę i klasyfikację nieedytowanego materiału wideo, przy zastosowaniu zasad indeksowania semantycznego. Zespół stworzyła najpierw szereg algorytmów, które umożliwiają wykrywanie pewnych rodzajów obiektów lub treści materiału wideo, a następnie automatycznie generuje metadane w celu ich opisania. Na przykład, system może wykrywać twarze (co wskazuje na obecność ludzi), regularne kształty (co pokazuje środowiska stworzone przez człowieka), rozmaite rodzaje roślinności, bądź też nawet różne rodzaje ruchów kamery. Umożliwia także klasyfikację różnych rodzajów audio, takich jak mowa, muzyka, hałas lub cisza; różnych rodzajów wód, takich jak morze, oceany, rzeki i zatoki; bądź też identyfikację zwykłych obiektów, takich jak autobusy, psy i statki. Detektor może wykrywać charakterystyczne błyski flesza aparatu, pomagając w wykrywaniu odcinków konferencji prasowych lub wywiadów dla dziennika wiadomości. "Zaadaptowaliśmy i połączyliśmy istniejące technologie wykorzystywane do wyszukiwania obrazów i odcinków wideo, lecz także stworzyliśmy pewne nowe aspekty, takie jak wykrywanie ruchu kamery oraz detekcję trójwymiarową 3D," mówi Dr Schreer. Inny zestaw algorytmów wykorzystuje wygenerowane metadane w celu łączenia i podsumowania treści, zapewniając pogrupowanie zawartości, co pomaga w wyszukiwaniu i dalszej obróbce. "Model metadanych, który jest sercem systemu, jest całkowicie innowacyjny," mówi on. Szybkie wyszukiwanie Kluczowym zadaniem projektu było stworzenie interfejsu użytkownika, umożliwiającego użytkownikowi dostęp do treści wideo w sposób dużo wydajniejszy. "Przeszukiwanie materiału wideo zajmuje dziennikarzom dużo czasu, toteż chcieliśmy im dać nowe narzędzia, by mogli oni dużo szybciej prowadzić poszukiwania w bazach danych wideo, co pomoże im w ponownym wykorzystaniu treści," mówi Dr Schreer.System opracowany w projekcie Rushes obejmuje szereg interfejsów do wyszukiwania i wizualizacji, począwszy od prostych poszukiwań w oparciu o tekst, aż do wyszukiwania "semantycznego" lub wizualnego. Technologiczne koncepcje takich narzędzi polegają na pogrupowaniu zawartości systemu w oparciu o hierarchiczne gromadzenie, semantyczne dopasowanie do kontekstu oraz przedstawienie odpowiedniości. "System bierze pod uwagę strukturę czasową materiału wideo, przedstawiając użytkownikowi znacznie więcej informacji o tym, jak została ona zorganizowana, oraz pomagając mu we wprowadzeniu jej do kontekstu. Umożliwia to użytkownikowi w znalezieniu odpowiedniego kontekstu oraz określonych jego części w sposób znacznie łatwiejszy i szybszy," dodaje Dr Schreer. Spojrzenie w przyszłość Zespół projektu, trwającego od lutego 2007 r. do lipca 2009 r., zaprezentował opracowany prototyp na szeregu wystaw technicznych w Europie, także na targach telekomunikacyjnych CEBIT w Hannowerze. "Reakcja, jaką widzieliśmy, była dobra, a przedstawiciele przemysłu uznali, że może to być rzeczywiście pomocne," mówi Dr Schreer. Indywidualni partnerzy projektu opracowują obecnie dalej indywidualne aspekty prototypu, a niektóre elementy współpracy są w dalszym ciągu kontynuowane. "Rezultaty uzyskane w ramach projektu będzie można zobaczyć w oferowanych produktach komercyjnych, które powinny pomóc profesjonalistom z rozgłośni," przewiduje on.Projekt Rushes otrzymał dofinansowanie na badania od UE w ramach Szóstego Programu Ramowego UE (6PR).