Research | Funded Projects

PARADIGMI ED APPLICAZIONI INNOVATIVE DELLA VISIONE ARTIFICIALE

La presente proposta progettuale intende proseguire le attività poste in essere nel progetto finanziato nella precedente annualità. In particolare, durante il primo anno l'attenzione è stata focalizzata principalmente verso la prima delle tre tematiche suddette, per la quale gli aspetti di innovatività ed originalità della ricerca hanno riguardato la definizione di algoritmi in grado di utilizzare informazioni di alto livello che descrivono gli elementi della scena da analizzare unitamente al comportamento che tali elementi possono assumere nella scena con informazioni di basso livello estratti dall’analisi dei pixel o altri elementi pittorici della scena. Le informazioni di alto livello sono rappresentate attraverso l’utilizzo di tecnologie e approcci del semantic web (ontologie e sistemi a regole decidibili in tempo polinomiale). Elemento caratterizzante l’attività di ricerca ha riguardato la possibilità di rendere dinamica la responsabilità da affidare alle due componenti del sistema: la parte di alto livello utilizzata per individuare gli elementi della scena sulla base delle informazioni fornite dagli algoritmi di analisi di basso livello o per validare l’estrazione degli elementi della scena fatti dagli algoritmi tradizionali o infine per supportare gli algoritmi di basso livello in situazioni dubbie, sfruttando il fatto che la componente di alto livello è in grado di memorizzare in forma compatta (ontologie) le informazioni salienti (es. persone o traiettorie) fino a quel momento estratte dai frame analizzati fino a quel momento a differenza degli algoritmi tradizionali che, per ragioni computazionali lavorano sul frame corrente sulla base di quello che hanno estratto dal frame precedente (storia recente). Nel presente progetto l'attenzione sarà focalizzata principalmente verso le seguenti due tematiche. Deep Learning Le tecniche basate su deep learning consentono di minimizzare il tempo necessario per progettare un buon set di features, poiché sono capaci di estrarre in modo automatico una rappresentazione robusta (nel caso specifico dell’azione) direttamente dai dati grezzi (le immagini), senza necessità che questi siano labellati, riducendo così l’onere dell’operatore di dover effettuare manualmente la ground truth (oltre che il progetto delle features). Sebbene promettenti, le tecniche ad oggi proposte non valutano in alcun modo l’aspetto temporale, che si rileva invece di notevole interesse per il riconoscimento di pattern quali azioni. Pertanto, l’originalità della presente ricerca riguarda l’estensione delle reti tradizionali basate su deep learning al fine di trattare in modo esplicito con l’aspetto temporale. In questo modo la rete può essere in grado di acquisire automaticamente dai dati grezzi non solo le informazioni discriminanti sulla sotto-azione che si sta compiendo al fotogramma corrente, ma allo stesso tempo sulle modalità con cui le sotto-azioni si seguono fotogramma dopo fotogramma.Architetture GPGPU L’originalità dell’attività di ricerca riguarda la definizione di architetture software per sistemi di visione artificiale in grado di sfruttare le piattaforme di computazione hardware di nuova generazione contraddistinte da chip contenenti un numero sempre maggiore di elementi di elaborazione general purpose (CPU) affiancati da elementi di elaborazione specializzati (GPU). L’idea è quindi quella di sfruttare tali architetture per eseguire non più una serie prefissata di algoritmi per le diverse fasi di analisi dei frame ma poter eseguire simultaneamente diversi algoritmi per ogni fase (o addirittura applicare tecniche di analisi completamente diverse) e poi fondere i risultati. Inoltre, alla luce delle limitazioni derivanti dall’utilizzo delle tecniche basate su deep learning evidenziate in precedenza, si progetterà un algoritmo parallelo per l’addestramento di tali reti, ad hoc per architetture GPGPU, tale da poter essere eseguito in tempi ridotti.

	Department	Dipartimento di Ingegneria dell'Informazione ed Elettrica e Matematica applicata/DIEM
	Principal Investigator	SAGGESE Alessia
	Funding	University funds
	Funders	Università degli Studi di SALERNO
	Cost	9.230,00 euro
	Project duration	29 July 2016 - 20 September 2018
	Research Team	SAGGESE Alessia (Project Coordinator) FOGGIA Pasquale (Researcher) GRECO Luca (Researcher) PERCANNELLA Gennaro (Researcher) RITROVATO Pierluigi (Researcher) VENTO Mario (Researcher)

Research | Funded Projects

Research Funded Projects

PARADIGMI ED APPLICAZIONI INNOVATIVE DELLA VISIONE ARTIFICIALE