CEEDS: nowe sposoby eksploracji dużych zbiorów danych
Duże zbiory danych to pojęcie odnoszące się do ogromnych ilości danych tworzonych bardzo szybko przez dużą liczbę zróżnicowanych źródeł. Dane mogą być tworzone przez ludzi lub generowane przez maszyny, takie jak czujniki gromadzące informacje o klimacie, obrazy satelitarne, cyfrowe zdjęcia i filmy wideo, dane transakcji zakupu, sygnały GPS itp. Obejmują wiele sektorów, od opieki zdrowotnej po transport i energetykę. Dane stały się kluczowym zasobem gospodarki i naszych społeczeństw, na podobieństwo klasycznych kategorii zasobów ludzkich i finansowych. Analitycy muszą obecnie stawić czoła ogromnemu napływowi danych, które trzeba przefiltrować, aby zaleźć rozwiązania współczesnych problemów. Niezależnie od tego czy są to informacje geograficzne, dane statystyczne, dane o pogodzie, dane badawcze, dane o transporcie, dane na temat zużycia energii czy stanu zdrowia, potrzeba ogarnięcia dużych zbiorów danych prowadzi do innowacji w technologii, powstawania nowych narzędzi i rozwoju nowych umiejętności. Jest to jedno z ważniejszych wyzwań w części poświęconej ICT nowego programu UE w zakresie badań naukowych i innowacji „Horyzont 2020”. Jednak pomoc w ewaluacji dużych zbiorów danych i ich przetwarzaniu może być w zasięgu ręki, choć z nieoczekiwanej strony... naszej podświadomości. Z uwagi na fakt, że jesteśmy świadomi zaledwie 10% aktywności naszego mózgu, naukowcy z projektu CEEDS poszukują sposobów na odblokowanie pozostałych 90%, aby przekonać się, czy może nam to pomóc w znalezieniu tego czego szukamy. Narzędzia wirtualnej rzeczywistości kluczem do przeniknięcia wielkich zbiorów danych CEEDS – Collective Experience of Empathic Data Systems – to próba „uwidocznienia” podświadomości za pomocą pomiaru reakcji sensorycznych i fizjologicznych na obserwowany przepływ dużych zbiorów danych. Naukowcy pracujący nad projektem zbudowali maszynę, która wykorzystuje narzędzia wirtualnej rzeczywistości do przenikania do tych wielkich zbiorów danych. Wykorzystując szereg systemów audio-wizualnych i taktylnych, monitoruje także reakcje użytkowników na doświadczenie, aby dowiedzieć się, na czym się koncentrują i jak to robią. Maszyna XIM (eXperience Induction Machine), która powstała w toku projektu CEEDS i znajduje się w Centrum Systemów Autonomicznych i Neurobiotyki kierowanym przez profesora Paula Verschure z Universitat Pompeu Fabra w Barcelonie, została zaprojektowana jako pomoc dla analityków w lepszym przyswajaniu dużych zbiorów danych. Dzięki monitorowaniu ich reakcji, dostarcza również informacji, które mogą być użyteczne w projektowaniu prezentacji danych w przystępniejszy sposób w przyszłości. Neuronaukowcy to pierwsza grupa, na której twórcy CEEDs przetestowali swoją maszynę. Typowe dla tej dyscypliny naukowej potężne zbiory danych zostały animowane za pomocą bodźców wizualnych i dźwiękowych. W komorze immersyjnej 3D do analizy reakcji użytkowników na dane znajduje się cała gama urządzeń. Czujniki ruchu śledzą zmiany postawy i ruchy ciała. Okulograf podpowiada użytkownikowi na czym się skupić i sprawdza rozszerzenie źrenic pod kątem objawów stresu. Rękawica „wyczuwa” ruchy ręki, mierzy uścisk i reakcje skórne. Kamery analizują wyraz twarzy. Sprzęt do analizy mowy wykrywa komponenty emocjonalne w wypowiedziach użytkownika i wydawanych przez niego dźwiękach. Wreszcie specjalnie zaprojektowana kurtka monitoruje puls i oddech. Zmierzono reakcje neuronaukowców na dane. Maszyna, wysyłając im podprogowe podpowiedzi w postaci migających strzałek, których nie byli świadomi, kierowała ich do obszarów potencjalnie bardziej atrakcyjnych z ich punktu widzenia. Było to pomocne również wtedy, kiedy stawali się zmęczeni lub przeładowani informacjami, poprzez dostosowanie prezentacji do ich nastroju. Koordynator projektu CEEDS, profesor Jonathan Freeman, psycholog z Uniwersytetu Goldsmiths w Londynie, wyjaśnia: „Użytkownikom pomaga uproszczenie wizualizacji danych, kiedy przyswajanie ich staje się zbyt trudne lub stresujące oraz intensyfikacja prezentacji, kiedy wydają się znudzeni”. Przyspieszanie analizy danych ma ogromną wartość Nowatorstwo podejścia CEEDS polega na tym, że mimo dostępności wielu komponentów oddzielnie, nikt ich jak dotąd nie połączył w jednym celu: zoptymalizowania rozumienia dużych zbiorów danych przez człowieka. Możliwych zastosowań CEEDS nie brakuje, od kontrolowania obrazowania satelitarnego i poszukiwania ropy, po astronomię, ekonomię i badania historyczne. „Potencjał tkwi wszędzie tam, gdzie bogactwo danych wymaga sporego nakładu czasu albo niewiarygodnie dużego wysiłku” – dodaje prof. Freeman. „Widzimy, że dla człowieka fizycznie niemożliwym jest analizowanie wszystkich docierających danych, najzwyczajniej ze względu na czas, jaki jest do tego potrzebny. Jakikolwiek system, który może przyspieszyć i usprawnić analizę ma ogromną wartość”. Przyszłe zastosowania CEEDS mogą również wiązać się nie tylko z dużymi zbiorami danych. System może pomóc w gromadzeniu opinii użytkowników w środowiskach fizycznych, takich jak sklepy, muzea czy biblioteki. Artyści występujący przed publicznością czy didżeje także zdają sobie teraz sprawę, że mogą pozyskiwać informacje o reakcjach odbiorców noszących np. bransoletki, które mierzą intensywność tańca, temperaturę ciała czy intensywność pocenia się. Nauka w klasie szkolnej również mogłaby przebiegać efektywniej, gdyby uczniowie mogli podłączać się do własnych podświadomych reakcji na powiedzmy wykresy. Innym zagadnieniem, jakie naukowcy analizowali w kontekście CEEDs to wprowadzanie doświadczeń archeologów w identyfikacji na przykład liczących sobie 2 000 lat kawałków wyrobów garncarskich do baz danych, aby przyspieszyć ich dopasowywanie w przyszłości. Projekt CEEDS, który zgromadził 16 partnerów z dziewięciu krajów, otrzymał 6,5 mln EUR z 7. programu ramowego UE jako projekt z dziedziny przyszłych i powstających technologii. Odnośnik do projektu na stronie CORDIS Odnośnik do strony internetowej projektu Twitter FET: przyszłych i powstających technologii