Skip to main content
European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Zawartość zarchiwizowana w dniu 2024-05-24

Ontology driven Temporal Text Mining on Organisational Data for Extracting Temporal Valid Knowledge

Article Category

Article available in the following languages:

Wdrażanie semantycznej sieci Web

Semantyczne informacje można pozyskiwać z danych w sieci Web i magazynować w sposób umożliwiający ich skuteczne wyszukiwanie dzięki innowacyjnej strukturze zorientowanej biznesowo i opracowanej w ramach projektu PARMENIDES.

Podejmowanie strategicznych decyzji, szczególnie w rozwijających się branżach i przy coraz bardziej konkurencyjnym wywiadzie, wymaga pozyskania odpowiednich informacji, np. o tendencjach rynkowych, fuzjach, czy wartości firmy. Cechą charakterystyczną procesu pozyskiwania stosownych informacji z wielu różnych źródeł jest konieczność zaangażowania sporych zasobów oraz wykonywania czynności często i regularnie. W projekcie PARMENIDES, finansowanym z Piątego Programu Ramowego, przyjęto oparte na ontologiach systemowe podejście do zintegrowania całego procesu gromadzenia informacji i analizowania ich. W celu umożliwienia przeszukiwania branży przy pomocy konwencjonalnych zapytań, opracowano specjalne metody, które w sposób półautomatyczny ustalają ontologie poszczególnych domen, opisują dokumenty za pomocą komponentów ontologicznych i identyfikują pośród nich poszczególne jednostki. W celu ustalenia ontologii nieustrukturyzowanych tekstów, głównie artykułów prasowych i sprawozdań niebędących częścią bazy danych, zastosowano dwie uzupełniające się metodologie. Metodologia oparta na szablonach, wywodząca się z badań nad przetwarzaniem języka naturalnego, wyraża strukturę i semantykę dokumentów poprzez szablony reguł, wzbogacając je opisami formalnymi. Z drugiej zaś strony, metodologia KDD (Knowledge Discovery in Databases - odkrywanie wiedzy w bazach danych) wspomaga odkrywanie konceptów i powiązań charakteryzujących dokumenty. Poza tym jest to istotne dla domeny dyskursu. Pozyskany kapitał informacyjny przechowywany jest w magazynie dokumentów, który wspomaga realizację zadań związanych z odkrywaniem wiedzy w danym okresie, umożliwiając dostrzeżenie nowych tendencji, które inaczej pozostałyby niewidoczne. Choć ogrom gotowych do użycia ontologii dostarcza ustandaryzowanego materiału koncepcyjnego, nierzadko w połączeniu z cennymi sugestiami na temat powiązań i relacji koncepcyjnych, wiedza ta wymaga częstej restrukturyzacji. System pozyskiwania wiedzy wypracowany w ramach projektu Paramenides może wypełnić ową lukę w materiale ontologicznym w domenach, które są przedmiotem licznych badań.

Znajdź inne artykuły w tej samej dziedzinie zastosowania