Funded Projects

Research Funded Projects

DATA MINING, TEXT MINING AND TEXTUAL NETWORKS.

OBIETTIVO.Obiettivo del progetto è la definizione e l'analisi di struttre di grafi di testo come struttura di base di dati. Tali strutture saranno quindi applicate all'individuazione e alla descrizione di concetti e ontologie in forma di reti di testi.I concetti sono entità, per loro natura, multidimensionale e complessa. La loro definizione può scaturire da diverse fonti: interviste, questionari a risposte aperte, raccolte di documenti, reti sociali, trascrizioni di diversa natura, ecc.L'insieme di documenti rappresenta una delle dimensioni di analisi, in un certo senso essi rappresentano le variabili di interesse. Potendo ogni testo apparire come un diverso contenitore di informazioni. I singoli testi che esso contiene, una volta sottoposti a trattamento lessicale (una sorta di standardizzazione) e all'eventuale tagging semantico, diventano le vere e proprie unità statistiche di analisi.Il nostro scopo è quello di studiare le relazioni che legano i singoli testi al fine di pervenire a una struttura di rete (grafo). Quando le osservazioni sono ripetute nel tempo, oppure quando esistano molteplici tipi di relazioni, la struttura di rete si complica maggiormente, divenendo una rete di tipo multiplex o multilayer.Definita la struttura del dato multi-relazionale, gli strumenti analitici e modellistici propri della SNA (Social Network Analysis) verranno utilizzati per esplorare, sintetizzare e modellizzare tali strutture di dati.Ad esempio, se il legame è definito dall'uso congiunto di testi per fornire la definizione data da un insieme di rispondenti a un concetto, le co-occorrenze rappresentano implicitamente una misura della capacità semantica espressa dagli individui per definire il concetto. L'estensione della rete ne rappresenta quindi la dilatazione semantica, le frequenze delle occorrenze rappresentano il peso dei singoli nodi, mentre le frequenze delle co-occorrenze sono il peso dei legami. Ruoli e posizioni nelle reti aiutano quindi a estrarre sottoinsiemi di testi ed a far emergere significati manifesti e latenti del concetto oggetto di studio.Si prevede di applicare il presente quadro investigativo a collezioni di documenti reali, provenienti dal web e da survey.Mentre le proprietà dei metodi proposti saranno convalidati da studi di simulazione, progettati ad hoc.Gli elementi di originalità del progetto si esplicitano nell'uso integrato di tecniche di Data Mining, Text mining e Social Network Analysis. L'interpretazione dei tradizionali indici di text-mining (tf-idf, ad esempio) nel quadro delle misure di rete, dovrebbero fornire un insieme di strumenti interpretativi innovativi e caratteristici.Il progetto si realizzerà in diverse fasi volte i) alla ricognizione della più recente letteratura scientifica sul tema; ii) alla sperimentazione di metodi e modelli di social network analysis alle reti di testi; iii) alla validazione e alla sperimentazione dei metodi attraverso l'uso di dati reali e studi di simulazione.La presentazione dei risultati intermedi a convegni nazionali e internazionali garantirà la bontà del lavoro nel suo divenire.Eventuali risultati degni di nota saranno sottoposti per la pubblicazione su riviste scientifiche di livello internazionale.

DepartmentDipartimento di Studi Politici e Sociali/DISPS
FundingUniversity funds
FundersUniversità  degli Studi di SALERNO
Cost3.600,00 euro
Project duration20 November 2017 - 20 November 2020
Proroga20 febbraio 2021
Research TeamGIORDANO Giuseppe (Project Coordinator)
CUCINA Domenico (Researcher)
D'ESPOSITO Maria Rosaria (Researcher)
DIANA Paolo (Researcher)
PRIMERANO Ilaria (Researcher)
RESTAINO Marialuisa (Researcher)
RUSSOLILLO Maria (Researcher)
VITALE Maria Prosperina (Researcher)