Projects

Research Projects

CROSS-LINGUAL INFORMATION RETRIEVAL (CLIR) E CULTURAL HERITAGE REPOSITORIES - UN APPROCCIO BASATO SULLA LINGUISTICA COMPUTAZIONALE

La ricerca nasce dall'esperienza del gruppo nel settore della linguistica computazionale applicata, nello specifico, a sistemi di Knowledge Management (KM) e Question Answering (QA) basati sul Natural Language Processing (NLP), Machine Translation (MT) e Machine Learning (ML), nonché dalle competenze eterogenee sviluppate nell'implementazione di strumenti per la gestione, comunicazione e valorizzazione del patrimonio culturale digitale e delle relative fonti documentali. Tale linea di ricerca si inserisce pienamente nelle iniziative promosse dal Ministero dei Beni e delle Attività Culturali al fine di sviluppare le risorse necessarie alla creazione di un sistema informativo in grado di contribuire alla diffusione del patrimonio storico-artistico. Esempi delle numerose attività messe in atto si ritrovano nella recente adesione alla Convenzione di Faro, convenzione culturale internazionale, recepita dall'Italia nel febbraio 2013, e nel progetto sugli open data, in ottemperanza alla Legge 221/2012 e al Decreto legislativo 14 marzo 2013, n. 33 – Riordino della disciplina riguardante gli obblighi di pubblicità, trasparenza e diffusione di informazioni da parte delle pubbliche amministrazioni. Nel perseguimento di questo scopo, il MiBac ha reso disponibili differenti dataset, liberamente scaricabili e riutilizzabili secondo diverse forme di licenze d'uso, con lo specifico intento di promuovere il proprio patrimonio informativo, sostenendo l'utilizzo di tali dati a fini di ricerca e di realizzazione di servizi e applicazioni. Gli open data rilasciati si riferiscono a dati aggregati di contenuti e informazioni forniti da varie istituzioni. Il portale Cultura Italia – Un patrimonio da esplorare riunisce i set provenienti da diverse fonti, tra cui: Anagrafe delle biblioteche italiane (ICCU), ArtPast – Progetto MiBAC, Galleria Nazionale d'Arte Moderna (GNAM), Internet Culturale, Progetto MICHAEL. La nostra proposta riguarda lo sviluppo di un’architettura che, quando applicata, mappi dati e metadati in un dato linguaggio sfruttando le informazioni morfo-sintattiche e semantiche presenti sia nei dizionari elettronici sia negli FSA/FSTs. Inoltre, il sistema è in grado di creare un mapping tra i tag linguistici e le strutture ai concetti del dominio specifico. L’ontologia utilizzata per il mapping delle entrate lessicali è il Conceptual Reference Model (CRM) fornita dall’International Council of Museums - Conseil International des Musees (ICOM- CIDOC), il cui intento è di facilitare l’integrazione, mediazione e l’interscambio di informazioni relative alla cultural heritage eterogenee. Il CIDOC CRM è composto da una gerarchia strutturata in 90 classi (che includono subclasses e superclasses) e 148 proprietà (e sottoproprietà). Il modello semantico object-oriented è compatibile con il Resource Description Framework (RDF). Il primo step eseguito dall’applicativo e una fase di pre-processing linguistico che formalizza le stringhe di linguaggio naturale in risorse linguistiche riutilizzabili. Durante questa prima fase avviene anche l’estrazione delle informazioni dalle query a testo libero degli utenti e il confronto di queste informazioni con le concettualizzazione già disponibili delle ontologie di dominio. Il sistema è strutturato in due workflow che lavorano simultaneamente ma in maniera indipendente: prima dell’esecuzione di una query su una knowledge base è necessario applicare le routine di trasformazione e di traduzione.

DepartmentDipartimento di Scienze Politiche e della Comunicazione/DISPC
FundingUniversity funds
FundersUniversità  degli Studi di SALERNO
Cost1.600,00 euro
Project duration11 December 2013 - 11 December 2015
Research TeamMONTELEONE Mario (Project Coordinator)
DI BUONO MARIA PIA (Researcher)
ELIA Annibale (Researcher)
MARANO FEDERICA (Researcher)
MELILLO LORENZA (Researcher)
VILLARI ILARIA MARIA (Researcher)