Figura professionale: Ricercatore Data Scientist, Data Mining, Product Manager
Nome Cognome | : G. Z. | Età | : 47 |
---|---|---|---|
Cellulare/Telefono | : Riservato! | : Riservato! | |
CV Allegato | : Riservato! | Categoria CV | : Analista Funzionale / Analista Tecnico |
Sede preferita | : Napoli |
Accesso Full al database con 29.998 CV a partire da € 5,00 ABBONATI SUBITO!
Sommario
Esperienze
Ricercatore Matematico Senior presso il CIRA (Centro Italiano di Ricerche Aerospaziali) www.cira.it
Keywords – Data/Text/Spatial/Temporal Mining, Machine Learning, Signal Process Mining, Big Data Analytics, Visual Analytics, Data Wrangling, Model Testing.
Già ricercatore di Tecnologie Software e di Soft Computing.
Con i ruoli di Ricercatore Data Scientist, Product Manager, System Engineer e di Project Engineer mi occupo dell'analisi e della progettazione di prodotti Software e di sistemi innovativi in ambito aerospazio (manutenzione, testing strutturale), ambiente (meteorologia), energia, bioinformatica (medicina, epidemiologia) finalizzati principalmente all'analisi di grandi quantità di dati, sia in streaming/real time che statici/storici, garantendo il raggiungimento degli obiettivi scientifici, metodologici, tecnologici e di qualità prefissati e l'ottimale utilizzo delle risorse assegnate.
Mi occupo di tecniche statistiche avanzate per l'analisi dati strutturati e non strutturati di diversa natura (spaziali, temporali, testuali, multidimensionali, etc.), di tecniche di Data e Text Mining comprensive di algoritmi di ​Machine Learning​, ​e di estrazione della conoscenza, seguendo la metodologia CRISP-DM ed il paradigma dei Big Data Analytics.
Ho lavorato o lavoro ai seguenti progetti sia nazionali che internazionali:
- PLATONE – "Platform for Integrated Health Life. Sviluppo di una piattaforma integrata paziente/territorio per la personalizzazione dei percorsi preventivi, predittivi e diagnostico-terapeutici comuni delle malattie cronico degenerative", con il ruolo di Project Engineer e di responsabile scientifico di WP, mi sto occupando della realizzazione del core analitico di un sistema software in grado di supportare l'utente, che per questo progetto è il medico, nell'intraprendere il più adeguato percorso diagnostico per i pazienti affetti da malattie neurodegenerative, cardiocircolatorie e tumorali. Un algoritmo basato su Data Mining e Machine learning è in grado di assegnare un livello di priorità a ciascun paziente che è basato sulla probabilità di ammalarsi in base all'analisi di innumerevoli fattori provenienti da indagini cliniche. Il progetto, ad alto contenuto di ricerca, è finanziato dal MISE, nel quadro del PON Imprese e competitività FESR 2014/2020 – Agenda Digitale.
- BIG DATA FACILITY, con il ruolo di Project Engineer e responsabile scientifico WP, mi sto occupando di analisi online di dati massivi in streaming, in ambiente real time, o near real time, con tecniche di Big Data Analytics ed in particolare di Machine Learning e Visual Analytics, utilizzando la piattaforma Hadoop. I domini di ricerca riguardano la meteorologia e la neurologia. In particolare, sto progettando e realizzando un algoritmo innovativo per la Cluster Analysis di serie temporali multivariate.
- SMAF, con il ruolo di System Engineer, mi occupo di analizzare dati provenienti da numerosi test di impatto di materiali impiegati per la progettazione di componenti avionici, con tecniche di Visual Analytics e Machine Learning.
- TECVOL II, in cui mi occupo, in qualità di System Engineer, della realizzazione di modelli temporali di previsione di nebbia su aeroporti italiani, utilizzando la metodologia CRISP per il Data Mining. In particolare, mi sono specializzato nell'analisi e nel forecasting a breve raggio temporale di eventi rari e outlier.
- SIDECO (SIstema Dati Energetici aperti e COndivisi) in cui, con il ruolo di Product Manager, mi sono occupato dell'analisi, progettazione e realizzazione di un dimostratore tecnologico software con l'obiettivo di collezionare, memorizzare ed analizzare flussi di dati di consumo e produzione energetici. Il sistema software è capace di gestire grandi quantità di dati rispettando il paradigma dei Big Data Analytics, ed include modelli adattivi di analisi avanzate realizzati ad hoc.
- SESARGSMET 2 (SESAR Ground Segment METeo), in cui, con il ruolo di System Engineer e Ricercatore Applicazioni, mi sono occupato della realizzazione di modelli di previsione di nebbia a breve range temporale (nowcasting) sull'aeroporto parigino di Charles de Gaulle, utilizzando la metodologia CRISP per il Data Mining, applicando algoritmi bayesiani e reti neurali.
- SIA (Sistema Informativo Aerospaziale), in cui, con il ruolo di Product Manager, mi sono occupato dell'analisi, progettazione e realizzazione di un dimostratore tecnologico per il recupero di informazioni utili per supportare i processi di certificazione aeronautica, utilizzando tecniche di Information Extraction e Natural Language Processing implementate. Inoltre, ho realizzato, sempre in qualità di Product Manager, un dimostratore tecnologico Knowledge–Based per la Text Analysis mediante l'utilizzo di Logiche per la rappresentazione della Conoscenza, in collaborazione con l'Università degli Studi di Napoli "Parthenope".
- IDES (Intelligent Data ExtractionSystem), con il ruolo di System Engineer, mi sono occupato dell'analisi, progettazione e realizzazione un dimostratore tecnologico per l'analisi automatizzata del patrimonio informativo aziendale, in collaborazione con l'Università degli Studi di Napoli "Federico II". Ho svolto attività di analisi e progettazione di un sistema di supporto alle decisioni (DSS) basato su modelli di Text Mining, su algoritmi per il trattamento automatico del linguaggio (Natural Language Processing), per l'Information Retrieval e Information Extraction. Ho realizzato anche un dimostratore tecnologico basato sull'analisi di correlazione di dati epidemiologici utilizzando algoritmi di Spatial Data Mining, finalizzato alle investigazioni per l'identificazione di illeciti ambientali, analizzando, con algoritmi di clustering e statistici, numerosi ed ampi dataset costituiti da dati e/o misure ambientali connesse a potenziali fonti di inquinamento, a andamenti di malattie e informazioni alfanumeriche attinenti a popolazione, attività produttive, ecc. Ho progettato, inoltre, un'app. SW per la visualizzazione dei risultati delle analisi su mappe geografiche.
- SIT_MEW (Sistema Integrato di Telecomunicazioni a larga banda per la gestione del territorio e delle emergenze in caso di calamità naturali comprensivo di Metodologie di Early Warning), finalizzato alla realizzazione di un prototipo di un sistema di allerta sismica e vulcanica in territorio campano. Con il ruolo di System Engineer e Ricercatore Applicazioni, ho partecipato all'attività di analisi e progettazione di un sistema di supporto alle decisioni (DSS) basato sulla metodologia CRISP per il di Data Mining per Early Warning. In particolare, ho realizzato modelli di Data Mining mediante l'applicazione di algoritmi per la classificazione, per la segmentazione e per l'analisi delle associazioni.
- NESM-3G, in cui mi sono occupato dello sviluppo di un ambiente per la simulazione dei vari moduli SW previsti dal progetto e per la valutazione della configurazione hardware dell'intero prototipo dimostratore. Ho messo appunto opportuni modelli da laboratorio in piccola scala con cui provare numerosi algoritmi e tecniche di Data Mining appicati a dati meteo.
ISTRUZIONE E FORMAZIONE
2008–alla data attuale
Ho seguito i seguenti corsi:
▪ “Professionals Soft Skills Development”, Prof. Francesco Donato Perillo (6 Webinar da 2 ore ciascuno + 2 seminari in aula da due ore ciascuno) , CIRA, Giugno-Ottobre 2019.
▪ "Introduzione al software KNIME Analytics Platform" e "Text Mining con KNIME Analytics Platform", Knime, presso Luiss Enlabs, Roma, 19-20 Aprile 2018.
▪ "Statistica con R. Livello Base ed Intermedio", Università degli Studi di Milano – Bicocca, tenuto dal Dr. Roberto Ambrosini e dal Prof. Riccardo Borgoni, presso CIRA, Capua (CE), 24-26 Gennaio 2017 e 01-03 Marzo 2017.
▪ "Data Analysis e Visual Analytics con Tableau", Evodevo, presso CIRA, Capua (CE), 20-21 Febbraio 2017.
▪ "Sviluppo di metodologie di diagnostica e prognostica per la manutenzione avanzata di sistemi di bordo. Tecniche di Machine Learning, Chaos Theory e Trasformate", Politecnico di Milano, Settembre 2016."
▪ Modern Data Visualizations e Story Telling" tenuto da John O'Brien, presso Technology Transfer S.r.l, Roma, 20 Novembre 2015.
▪ "Data Discovery in Action" tenuto da John O'Brien, presso Technology Transfer S.r.l, Roma, 18- 19 Novembre 2015.
▪ "Big Data Multi-Platform Analytics" tenuto da Mike Ferguson, presso Technology Transfer S.r.l, Roma, 25-27 Giugno 2014.
▪ "IBM – SPSS Statistic per Data Analysis", tenuto da IBM-SPS Italia, presso CIRA, Capua (CE), Maggio-Luglio 2013.
▪ "IBM – SPSS Modeler per Data Analysis and Mining", tenuto da I4C Analytics, presso CIRA, Capua (CE), dal 18 Gennaio 2012 al 2 Agosto 2012.
▪ "Corso K4A: Breve introduzione al Sistema Elicottero", presso CIRA, Capua (CE), 23 Settembre 2009.
▪ "Progettazione del Data Warehouse", Prof. Matteo Golfarelli, di Technology Transfer, presso CIRA, Capua (CE), 13-15 Maggio 2009.
▪ "Model Driven Systems Development", presso CIRA, Capua (CE), Luglio 2008.
▪ "UML 2.0", presso CIRA, Capua (CE), Luglio 2008.
▪ "SIEBEL Essential Training 7.7", presso Value Team, Roma, 07-31 Gennaio 2008.
2008–alla data attuale
Ho seguito i seguenti seminari:
▪ "Intelligenza Artificiale: Dall'Università alle Aziende. La Rivoluzione del Deep Learning", presso
Laboratori delle Arti – Università di Bologna, Bologna, 12 Aprile 2017.
▪ "L'ottimizzazione non lineare nei problemi di classificazione", tenuto dal prof. Manlio Gaudioso,
Napoli, 30 Novembre 2016.
▪ "International Big Data Analytics Conference 2016", tenuto da Mike Ferguson, Rick van der Lans,
Tim Seears, Vladimir Bacvanski, presso Technology Transfer, Roma, 28-29 Novembre 2016
▪ "2016 Conference on Big Data from Space (BiDS)", 15-17 March 2016, Santa Cruz de Tenerife,
Spain.
▪ "L'Internet delle Cose (IoT) e Fast Data Mining", Dott. Nino Vincenzo Guarnacci, presso Seconda
Università degli Studi di Napoli (SUN), Aversa (CE), 07 Maggio 2014.
▪ "Building Knowledge and Intelligence from Big Data Streams", Prof. Fatos Xhafa, presso Seconda
Università degli Studi di Napoli (SUN), Aversa (CE), 14 Aprile 2014.
▪ "Dai Big Data ai Fast Data", presso STRHOLD REWEB, Roma, 09 Aprile 2014.
▪ "Building Knowledge and Intelligence from Big Data", Prof. Fatos Xhafa, presso Seconda
Università degli Studi di Napoli (SUN), Aversa (CE), 08 Aprile 2014.
▪ "Verso modelli a larga scala di sistemi celebrali: un nuovo metodo per ridurre la complessità dei
neuroni", Prof. Michele Migliore, presso Università degli Studi di Napoli "Federico II", Napoli, 04
Dicembre 2013.
▪ "Logica e Informatica: cenni storici e alcuni sviluppi recenti", Dott. Luigi Sauro, presso Università
degli Studi di Napoli "Federico II", Napoli, 01 Febbraio 2013.
▪ "Teoria dei giochi fra passato e futuro", prof. Roberto Lucchetti, presso Seconda Università degli
Studi di Napoli (SUN), Caserta, 28 Settembre 2011.
▪ "Machine Learning/Support Vector Machine", Prof. Camastra di Università degli Studi di Napoli
"Parthenope", presso CIRA, Capua (CE), 08 Luglio 2010
11/1998–24/05/2006 Laurea in Matematica (Vecchio Ordinamento), 110/110 e lode.
inglese B1
Competenze organizzative e gestionali
▪ WP leader (attualmente responsabile di un team di 4 persone) nell'ambito del progetto Big Data Facilty.
▪ Commissario incaricato per l'aggiudicazione del "Servizio HW e SW dell'infrastruttura di
videosorveglianza del CIRA", in conformità al regolamento del codice degli appalti pubblici.
▪ WP leader e responsabile di gestione di forniture SW e di prestazioni da parte di docenti
universitari nell'ambito dei progetti IDES (Intelligent Data Extraction System) e SIA (Sistemi
Informativi Aerospaziali).
▪ Responsabile tecnico e referente unico di 3 tirocinanti universitari e di 2 prestazioni di forniture.
▪ Autore unico di 8 capitolati tecnici per bandi di gara per acquisto di forniture SW e per consulenze da parte di dipartimenti universitari.
▪ Autore o co-autore di 11 proposte di progetti europei e nazionali (POR, PON, H2020, STAR, …)
Competenze professionali
▪ Ottima conoscenza di algoritmi di Machine Learning e Pattern Recognition per Data/Text Mining ed Analitycs. In particolare, Reti Neurali, Alberi Decisionali Induttivi, Regole Associative, Macchine a Supporto Vettoriale, Reti Bayesiane, Clustering, tecniche Meta-classificatorie (Costsensitive, Semi-Supervized, Ensemble, Voting), etc.
▪ Ottima conoscenza di tecniche per il preprocessing automatico di dati numerici, spazio-temporali, testuali (ETL spaziale, Testuale).
▪ Ottima conoscenza della metodologia CRISP-DM per Knowledge Discovery in Databases Process.
▪ Ottima conoscenza di tecniche statistiche per Big Data Analitycs.
▪ Ottima conoscenza di tecniche di Modern Data Visualizations e Visual Analytics.
▪ Ottima conoscenza di algoritmi di analisi di serie temporali.
▪ Buona conoscenza delle tecniche per Big Data Management.
▪ Buona conoscenza di algoritmi di Natural Language Processing e Text Analysis.
▪ Buona conoscenza del linguaggio di programmazione R.
▪ Discreta conoscenza del linguaggio di programmazione Python.
▪ Discreta conoscenza del linguaggio SQL e dei Modelli Relazionali E/R.
▪ Discreta conoscenza del linguaggio UML e delle metodologia RUP , per l'ingegneria del software.
▪ Discreta conoscenza dei linguaggi Matlab e Prolog.
▪ Sufficiente conoscenza del linguaggio Fortran e Java.
Competenze digitali – Scheda per l'autovalutazione
▪ Utilizzo dei seguenti tool: IBM SPSS Modeler – IBM SPSS Statistics – SAS JMPpro – WEKA –
KNIME – R – Miner 3D – Orange Data Mining – RapidMiner – RapidNet – Tableau – Qlik – Power
BI – Trifacta Wrangler – Tanagra – AlphaMiner – Mining Mart – SofaStats – TaLTaC2 – GATE –
KEA – Hadoop – Geogebra – Cabri Geometre – Derive – Microsoft Windows – Ms Office –
Mathematica – Matlab – Hadoop – Esper – OpenTSDB – Grafana – MySQL Cluster –
Postgres/PostGIS – GeoKettle – Quantum GIS – ArcGIS – StarUML.
Pubblicazioni
Sono autore dei seguenti articoli pubblicati su journal, riviste, o a conferenze:
1. Zazzaro G., Martone A., Montaquila R.V., Pavone L., "From Electroencephalogram to Epileptic
Seizures Detection by Using Artificial Neural Networks", International Journal of Health and Medical
Engineering Vol:13, No:9, 2019.
2. Zazzaro G., Martone A., "Fuzzy Outlier Detection by applying the ECF-Means Algorithm. A
clustering ensemble approach for mining large datasets", being published in IARIA International
Journal On Advances in Software, v 12 n 1&2 2019.
3. Zazzaro G., Cuomo S., Martone A., Montaquila R.V., Toraldo G., Pavone L., "EEG Signal Analysis
for Epileptic Seizures Detection by Applying Data Mining Techniques", Internet of Things, 2019, ISSN
2542-6605, https://doi.org/10.1016/j.iot.2019.03.002.
4. Martone A., Zazzaro G., Pavone L., "A Feature Extraction Framework for Time Series Analysis. An
application for EEG signal processing for epileptic seizures detection", Fifth International Conference
on Big Data, Small Data, Linked Data and Open Data, ALLDATA 2019, Valencia, Spain, March 24 –
28, 2019.
5. Zazzaro G., Martone A., "ECF-means – Ensemble Clustering Fuzzification Means. A novel
algorithm for clustering aggregation, fuzzification, and optimization", Eighth International Conference
on Advances in Information Mining and Management, IMMM 2018, Barcelona, Spain, July 22 – 26,
2018.
6. Zazzaro G., Romano G., Mercogliano P., "Data Mining for Forecasting Fog Events and Comparing
Geographical Sites. Designing a novel method for predictive models portability", IARIA International
Journal On Advances in Networks and Services, v 10 n 3&4 2017.
7. Zazzaro G., Martone A., Romano G., Ferrucci M., "An Adaptive Technique for Energy
Consumption Anomaly Detection", 8th Scientific Conference on INNOVATION & SOCIETY Statistical
Methods for Evaluation and Quality September 6th -7 th 2017 Naples – Italy.
8. Martone A., Zazzaro G., Romano G., "Un'architettura scalabile per la real-time streaming analytics.
Un'applicazione per l'Energy Management & Forecasting", AIDA Informazioni: Rivista di Scienze
dell'Informazione, Anno 35, numero 1-2, 2017.
9. Zazzaro G., Mercogliano P., Romano G., "Bayesian and Artificial Neural Network to Nowcast Rare
Fog Events", in Proc. of The Ninth International Conference on Advances in Databases, Knowledge,
and Data Applications, Barcelona, Spain, May 21 – 25, 2017.
10. Zazzaro G., Romano G., Mercogliano P., Rillo V. and Kauczok S., “Short Range Fog Forecasting
by applying Data Mining Techniques", in Proceedings of 2nd IEEE International Workshop on
Metrology for Aerospace, Benevento, Italy, June 3-5 2015, pp 469-474.
11. Pigliasco G., Zazzaro G., “GeoTagView: Visualizing Geographic Tags Easily", in Proc. of The
Third International Conference on Data Analytics, DATA ANALYTICS 2014, (IARIA '14), Rome, Italy,
2014.
12. Gargiulo F., Zazzaro G., Romano G., Gigante G., Raggioli A. and Fusco R., “Aerospace
Information System based on Semantic Technologies and Ontology Management – A Web Portal for
Semantic Search and Document Categorization", in Proc. of The 3rd International Conference on Data
Management Technologies and Applications (DATA), Vienna, Austria, 2014.
13. Zazzaro G., Gigante G., Zaccariello E., Ficco M., and Di Martino B., “Supporting Development of
Certified Aeronautical Components by Applying Text Analysis Techniques", in Proc. of the 8th Int. Conf.
on Complex, Intelligent, and Software Intensive Systems (CISIS'14), Birmingham, UK, 2014.
14. Garbarino L., Zazzaro G., Genito N., Fasano G., Accardo D., “Neural Network Based Architecture
for Fault Detection and Isolation in Air Data Systems", DASC.2013.6712547 Conference: Digital
Avionics Systems Conference (DASC), 2013 IEEE/AIAA 32nd.
15. Zazzaro G., Pisano F.M., Romano G., “Bayesian Networks for Earthquake Magnitude
Classification in a Early Warning System", CDMKE 2012 – International Conference on Data Mining
and Knowledge Engineering, Volume: World Academy of Science, Engineering and Technology 64,
2012.
16. Zazzaro G., Mercogliano P., Pisano F.M., “Data Mining to Classify Fog Events by applying CostSensitive Classifier", DOI: 10.1109/CISIS.2010.72 Conference: CISIS 2010, The 4th International
Conference on Complex, Intelligent and Software Intensive Systems, Krakow, Poland, 15-18 February
2010.
Seminari
Sono stato relatore dei seguenti seminari universitari:
▪ 5 Aprile 2018 – Big Data Analytics per applicazioni di Knowledge Discovery: introduzione al Data
Mining – Università degli Studi di Napoli "Federico II", Facoltà di Scienze, Dip. di Matematica "R.
Caccioppoli", Napoli, prof. Gerardo Toraldo, CdL Matematica e Mathematical Engineering.
▪ 5 Aprile 2018 – Big Data Analytics per applicazioni di Knowledge Discovery: caso di studio per le
previsioni meteorologiche – Università degli Studi di Napoli "Federico II", Facoltà di Scienze, Dip. di
Matematica "R. Caccioppoli", Napoli, prof. Gerardo Toraldo, CdL Matematica e Mathematical
Engineering.
▪ 3 Dicembre 2015 – Tecniche di Temporal Data Mining per applicazioni di Previsioni di Nebbia –
Università degli Studi di Napoli "Federico II", Facoltà di Ingegneria, Napoli, nell'ambito del Corso di
Data Mining – prof. Ing. Carlo Sansone, CdL Magistrale in Ingegneria Informatica.
degli Studi di Napoli "Federico II", Facoltà di Ingegneria, Napoli, nell'ambito del Corso di Intelligenza
Artificiale – prof. Ing. Carlo Sansone, CdL Magistrale in Ingegneria Informatica.
▪ 13 Maggio 2010 – Introduzione alla Business Intelligence: dai dati alla conoscenza. Tecniche di
Data Mining per l'apprendimento supervisionato ed esempi applicativi (case study) – Seconda
Università di Napoli (SUN) – Dipartimento di Ingegneria dell'Informazione, Aversa (CE), nell'ambito
del Corso di Ingegneria del Software e Sistemi Informativi – prof. Ing. Massimo Ficco.
▪ 18 Dicembre 2009 – Introduzione alla Business Intelligence: dai dati alla conoscenza. Tecniche di
Knowledge Discovery: Data Mining (case study) – Seconda Università di Napoli (SUN) –
Dipartimento di Ingegneria dell'Informazione, Aversa (CE), nell'ambito del Corso di Ingegneria della
Conoscenza e Sistemi Esperti – prof. Beniamino Di Martino.
▪ 12 Gennaio 2009 – Dai dati alla conoscenza: il Knowledge Management per gestire il patrimonio
conoscitivo in Azienda. Tecniche di Knowledge Discovery: Data e Text Mining (case study) –
Seconda Università di Napoli (SUN), Dipartimento di Ingegneria dell'Informazione, Aversa (CE),
Nell'ambito del Corso di Ingegneria della Conoscenza e Sistemi Esperti – prof. B. Di Martino.
▪ 27 Aprile 2012 – Tecniche di Data Mining per applicazioni di Early Warning Sismico – Università
235 total views, 1 today