Zmniejszenie cyfrowej przepaści między poezją a technologią
W cyfrowym świecie wszystko sprowadza się do danych, a poezja nie jest wyjątkiem. „Udostępniając poezję online w postaci danych do odczytu maszynowego, otwieramy drzwi do nowych możliwości łączenia, indeksowania i pozyskiwania nowych informacji”, mówi Elena González-Blanco, dyrektor ds. badań na Uniwersytetu IE oraz dyrektorka i założycielka zespołu badawczego LINHD, Laboratorium Cyfrowych Innowacji w Naukach Humanistycznych, które działa przy hiszpańskim uniwersytecie Universidad Nacional De Educación a Distancia. Środki przekazane przez UE na prowadzenie projektu POSTDATA González-Blanco wykorzystuje do wypełnienia cyfrowej przepaści między poezją a technologią. „Łącząc najnowocześniejsze badania filologiczne z obliczeniowymi, tworzymy wirtualny świat poezji pełnej połączeń semantycznych”, wyjaśnia. „Chcemy w ten sposób doprowadzić do przekształcenia tradycyjnych badań nad poezją w środowisko cyfrowych badań humanistycznych”.
Innowacyjny model ontologiczny
Koncentrując się na analizie, klasyfikacji i publikacji poezji, w ramach tego wspieranego przez Europejską Radę ds. Badań Naukowych projektu badacze opracowali innowacyjny model ontologiczny pozwalający badać interoperacyjność różnych zbiorów poezji. Model jest w pełni zgodny z formalną ontologią FRBRoo: „Jego celem jest uchwycenie i przedstawienie semantyki leżącej u podstaw informacji bibliograficznych oraz ułatwienie integracji, pośrednictwa w przekazywaniu i wymiany informacji bibliograficznych i muzealnych”, wyjaśnia. „Korzystamy z technologii sieci semantycznej, aby w uporządkowany sposób wiązać ze sobą dane literackie i publikować je w zbiorach, które będą połączone z chmurą danych”, mówi González-Blanco. Ale zespół POSTDATA sięga dalej i analizuje wiersze za pomocą sztucznej inteligencji. „Chcemy umożliwić badaczom analizowanie hiszpańskiej poezji w sposób zautomatyzowany. Dlatego pracujemy nad zestawem narzędzi, które będą korzystać z przetwarzania języka naturalnego”.
Cyfryzacja poezji ma szereg zalet
Dlaczego warto cyfryzować poezję? Według González-Blanco udostępnianie twórczości poetyckiej online z dołączonymi do niej danymi do odczytu maszynowego ma wiele zalet. Badaczka zauważa: „Przede wszystkim przygotowaliśmy w ten sposób dostępną platformę cyfrową dla społeczności naukowej, która umożliwia pracę z korpusami poetyckimi i wzbogacanie ich własnymi tekstami. Z zasobów tych będzie można również korzystać w celach edukacyjnych, działaniach rozpowszechniających kulturę, a nawet w rozrywce”. González-Blanco dodaje, że dzięki zastosowaniu standardowych technologii i oprogramowania typu open source ta metoda kodowania i standaryzacji informacji poetyckiej gwarantuje również jej zachowanie. „Wiele poezji można znaleźć tylko w starych książkach. Część jest wręcz przekazywana ustnie”, dodaje. „Cyfryzując i przechowując tekst w postaci plików XML, pomagamy zapewnić mu miejsce w dorobku kulturowym”.
Duży krok w kierunku pełnego repozytorium poezji
Według González-Blanco projekt POSTDATA stanowi duży krok w kierunku zbudowania obszernego, zawsze dostępnego i interoperacyjnego repozytorium poezji. „Udało się nam utworzyć ontologię, ale też i najnowocześniejsze narzędzia wykorzystujące sztuczną inteligencję oraz przetwarzanie języka naturalnego do automatycznej analizy poezji”, podsumowuje. „Wyniki są po prostu niesamowite”. Obecnie w ramach projektu są prowadzone prace nad przygotowaniem strony internetowej, na której badacze udostępnią zastosowane narzędzia i przedstawią wyniki prac. Naukowcy opracowują również nowe paradygmaty obliczeniowe, by umożliwić dalszą analizę twórczości poetyckiej, w tym także tekstów piosenek.
Słowa kluczowe
POSTDATA, luka cyfrowa, poezja, technologia, technologie cyfrowe, sztuczna inteligencja, uczenie maszynowe, przetwarzanie języka naturalnego, dane, badania obliczeniowe, ontologiczne