Projects

Research Projects

STIMATORI ROBUSTI DI LOCAZIONE-SCALA PER DATI CON ELEVATA DIMENSIONALITÀ

Il progetto si propone di studiare stimatori robusti multivariati ingrado di superare alcuni dei limiti degli strumenti ad oggi disponibili(vedi rassegna nella Sezione 11). In particolare ci proponiamo diderivare stimatori che:1) inglobano una definizione di outlier che dipende da una classe dimodelli di riferimento;2) siano definiti in base a parametri di tuning direttamenteinterpretabili;3) siano capaci di gestire regimi campionari con p/n <= 1;4) siano dotati di proprietà statistiche desiderabili (equivarianzaaffine, consistenza, buoni tassi di convergenza);5) siano calcolabili con algoritmi efficienti, di provata stabilità, etali da preservare tutte le proprietà statistiche.Mella letteratura classica l'outliers è trattato come osservazionecontaminante, ovvero esterna al meccanismo che produce i dati diinteresse. A partire dai lavori di Davies e Gather (1993, 1995) si èdiffusa una visione "relativistica" dove l'outlier è definito rispettoad un modello o una classe di modelli di riferimento. Un punto potrebbeessere outlying rispetto ad un modello Normale e non esserlo rispetto adun modello Student-t. Inoltre la qualifica di outliers dipende dalladimensione campionaria, in quanto la dimensione campionaria determina ilnumero di atteso di osservazioni sotto le code della distribuzione diriferimento. Lo scrivente insieme a Christian Hennig (UCL, London, UK)ha già proposto nel 2013 uno stimatore multivariato di locazione-scalain grado di trattare automaticamente punti anomali rispetto al modellonormale. Tale stimatore, denominato "Black Hole Location-ScaleEstimator" (BHLSE) è definito in termini di equazioni di stima derivatea partire da uno pseudo-modello per i dati osservati. Questo pseudomodello rappresenta la densità dei dati in termini di una mistura di unadensità normale ed una densità impropria e costante nella regione dicoda della componente normale. Siccome tale componente impropria è nonnegativa ovunque, essa consentirà di accomodare qualsiasi tipo dioutlier anche nelle forme più estreme. Il BHLSE è ispirato al punto 1),ed è definito da tunings di facile ed immediata interpretazione (vedipunto 2). Pertanto esso rappresenterà il centro di interesse dellanostra indagine scientifica.In questo progetto ci proponiamo di risolvere gli obiettivi 3-5,partendo dal BHLSE. In particolare saranno studiate soluzioni emiglioramenti che permettono al BHLSE di gestire regimi campionari dovep/n <= 1. Saranno inoltre studiati algoritmi efficienti e di provatastabilità numerica. Una grosso sforzo sarà destinato alla verificadelle proprietà teoriche del BHLSE. L'originalità della proposta è chein questo progetto siamo interessati a trovare una formulazione tale chela successione di stime coincida con la successione delle soluzioninumeriche prodotte dall'algoritmo di calcolo. In altre parole, in questoprogetto siamo interessati a provare le proprietà statistiche di ciò checalcoliamo, piuttosto che guardare alle proprietà statistiche di ciò chesi stima indipendentemente dalla sua relativa approssimazionenumerica. Da questo punto di vista il progetto introduce innovazionisostanziali di enorme importanza. La presente proposta si avvarrà dimetodi computazionali complessi che richiedo un grosso impiego dirisorse di calcolo. A conclusione di questa ricerca ci proponiamo anchedi corredare i risultati ottenuti con software da utilizzare sottolicenza GPL per scopi non commerciali.

DepartmentDipartimento di Scienze Economiche e Statistiche/DISES
FundingUniversity funds
FundersUniversità  degli Studi di SALERNO
Cost2.301,00 euro
Project duration28 July 2015 - 28 July 2017
Proroga28 Luglio 2018
Research TeamCORETTO Pietro (Project Coordinator)
LA ROCCA Michele (Researcher)
PARRELLA Maria Lucia (Researcher)
STORTI Giuseppe (Researcher)