Categoria: Big Data

Appunti di Big Data. Il corso è tenuto dal Professor Torlone all’Università degli studi di Roma Tre nella facoltà di Ingegneria Informatica. Questi appunti sono stati presi dagli studenti durante il corso nei vari anni. Sono presenti alcune integrazioni con materiale online. Il corso mira a illustrare le moderne soluzioni tecniche e metodologiche al problema della gestione dei big data. Sono collezioni di dati destrutturati le cui dimensioni superano le capacità di memorizzazione, gestione e analisi tipiche dei tradizionali sistemi per basi di dati. Partendo dai requisiti delle moderne applicazioni, verranno affrontate le diverse problematiche della loro memorizzazione e uso. Computer clusters; Cloud computing; Data lakes; Hadoop & Map-reduce; Spark; Big data tools quali Pig, Hive, Tez, Dremel, Giraph, Storm, Mahout, and Open R; NoSQL database systems; Data analytics; Open data; Social networks; Genomic data management.