Articoli di approfondimento - Una tecnologia di ricerca in grado di fare una stima delle opinioni e prevedere il futuro
"Fate una ricerca sulla parola "clima" su Google o su un altro motore di ricerca e quello che otterrete è in pratica una lista di risultati che contengono tale parola: non c'è alcuna classificazione, ordine specifico o contesto. Gli attuali motori di ricerca non tengono conto delle dimensioni della diversità: fattori come il momento in cui è stata pubblicata un'informazione, se c'è un'inclinazione verso un'opinione o un'altra inerente al contenuto o alla struttura, chi l'ha pubblicata e quando," spiega Fausto Giunchiglia, un professore di scienze informatiche presso l'Università di Trento in Italia. Si può fare una tecnologia di ricerca in grado di identificare e includere la diversità? Può un motore di ricerca dirvi, per esempio, come è cambiata l'opinione pubblica sui cambiamenti climatici negli ultimi dieci anni? o come sarà il tempo tra un secolo, mettendo insieme le stime attuali e passate provenienti da fonti diverse? A quanto pare è possible, grazie a una nuova combinazione di scienze moderne e un metodo di classificazione vecchio di decenni, messi insieme da alcuni ricercatori europei nel progetto LivingKnowledge (1). Sostenuto con 4,8 milioni di euro in finanziamenti della Commissione europea, il team di LivingKnowledge, coordinato dal Prof. Giunchiglia, ha adottato un approccio multidisciplinare per sviluppare una nuova tecnologia di ricerca, attingendo a settori come l'informatica, le scienze sociali, la semiotica e la biblioteconomia. Il cosiddetto padre della biblioteconomia infatti, Sirkali Ramamrita Rangagathan, un bibliotecario indiano, è stato una fonte di ispirazione per i ricercatori. Negli anni 1920 e 1930, Rangagathan ha sviluppato il primo sistema di classificazione analitico-sintetico o sfaccettato. Usando questo approccio, agli oggeti – libri, nel caso di Ranganathan, al contenuto del web e dei database, nel caso del team di LivingKnowledge – vengono assegnati diverse caratteristiche e attributi (sfaccettature), il che permette di ordinare la classificazione in molteplici modi, rispetto a un solo, predeterminato, ordine tassonomico. Usando questo sistema, un articolo sugli effetti dei cambiamenti climatici sull'agricoltura scritto in Norvegia nel 1990 può essere classificato come "Geografia, clima, cambiamento climatico, Agricoltura, Ricerca, Norvegia, 1990." Per capire meglio il sistema di classificazione e implementarlo nella tecnologia dei motori di ricerca, i ricercatori di LivingKnowledge si sono rivolti all'Istituto indiano di statistica, un partner del progetto, che usa la classificazione sfaccettata quotidianamente. "Usando le loro conoscenze abbiamo potuto trasformare lo pseudo-algoritmo di Ranganathan in un algoritmo per computer e gli esperti di informatica sono stati in grado di usarlo per estrarre dati dal web, ricavare il loro significato e contesto e assegnar loro le sfaccettature, che sono state usate per strutturare le informazioni sulla base delle dimensioni di diversità," dice il Prof. Giunchiglia. I ricercatori dell'Università di Pavia in Itaila, un altro partner del progetto, si sono basati sulle loro competenze nell'estrazione del significato dal contenuto del web – non solo da testi e contenuti multimediali, ma anche dal modo in cui le informazioni sono strutturate e presentate – per dedurre inclinazioni e opinioni, aggiungendo un'altra sfaccettatura ai dati. "Siamo stati in grado di identificare le inclinazioni degli autori su un certo argomento e se le loro opinioni fossero positive o negative," dice il coordinatore di LivingKnowledge. "I fatti sono fatti, ma qualsiasi informazione su un evento, o su qualsiasi argomento, è spesso circondata da opinioni e inclinazioni." Dalle biblioteche degli anni 1930 ai viaggi nello spazio nel 2034… La tecnologia è stata implementata in un banco di prova, adesso disponibile come software open source ed è stata usata per esperimenti basati su due interessanti scenari di applicazione. In collaborazione con l'istituto di ricerca sociale austriaco SORA, il team ha usato il sistema LivingKnowledge per identificare tendenze sociali e monitorare l'opinione pubblica in termini sia quantitativi che qualitativi. Usato per l'analisi di contenuti mediatici, il sistema potrebbe aiutare un'azienda a capire l'impatto di una nuova campagna pubblicitaria, mostrando come essa ha influenzato il riconosimento del marchio nel tempo e quali gruppi sociali sono stati i più ricettivi. In alternativa uno stato potrebbe usare il sistema per misurare l'opinione pubblica su una nuova politica o un politico potrebbe usarlo per rispondere nel modo più accettabile pubblicamente alle affermazioni di un candidato rivale. Con Barcelona Media, una fondazione di ricerca no profit sostenuta da Yahoo! e con la Internet Memory Foundation con sede nei Paesi Bassi, il team di LivingKnowledge ha esaminato non solo le tendenze attuali e future, ma le ha estrapolate e ha preso previsioni fatte su dati esistenti per cercare di prevedere il futuro. L'applicazione Future Predictor è in grado di fare ricerche basate su domande come "Quale sarà il prezzo del petrolio nel 2050?" o "Quanto si alzeranno le temperature globali nei prossimi 100 anni?" e trovare informazioni rilevanti e previsioni sul web di oggi. Per esempio, una ricerca sull'anno 2034 vede "i viaggi nello spazio" come l'argomento più rilevante indicizzato nelle notizie del giorno. "Più direttamente, questo scenario di applicazione fornisce una funzionalità per rilevare tendenze anche prima che tali tendenze diventino palesi negli eventi quotidiani – sulla base di capacità integrate di ricerca e navigazione per trovare informazioni diverse, multidimensionali che dipendono dal contesto, le inclinazioni e il tempo," spiega il prof. Giunchiglia. Diversi partner del progetto hanno in programma di implementare questa tecnologia sul piano commerciale e il coordinatore del progetto intende istituire una fondazione no profit per costruire sui risultati di LivingKnowledge in un momento in cui la domanda per questo tipo di tecnologia aumenterà sicuramente. Il prof. Giunchiglia sottolinea che Google ha fondamentalmente cambiato il mondo assicurando a tutti l'accesso a una gran delle parte delle informazioni mondiali, ma lo ha fatto per le persone. Attualmente solo gli esseri umani possono capire il significato di tutti quei dati, tanto che il sovraccarico di informazioni è un problema frequente. Man mano che ci avviciniamo all'era dei "grandi dati" nella quale le informazioni su tutto sono disponibili premendo semplicemente un tasto, il significato di queste informazioni deve essere comprensibile non solo per gli esseri umani ma anche per le macchine, la quantità deve quindi essere associata alla qualità. Il metodo di LinvingKnowledge si occupa di questo problema. "Quando abbiamo cominciato il progetto, nessuno parlava di grandi dati. Adesso ne parlano tutti e c'è sempre più interesse in questo tipo di tecnologia," dice il prof. Giunchiglia. "Il futuro sono i grandi dati. Non sappiamo ancora se sarà positivo o negativo, ma sarà certamente diverso." Armato del Future Predictor del progetto, il prof. Giunchiglia è ben attrezzato per fare tale previsione. LivingKnowledge ha ricevuto finanziamenti per la ricerca nell'ambito del Settimo programma quadro (7˚ PQ) dell'Unione europea. (1) "LivingKnowledge facts, opinions and bias in time" Link utili: - Sito web "LivingKnowledge facts, opinions and bias in time" - Scheda informativa del progetto LivingKnowledge su CORDIS