Adreçat a estudiantat de grau i màster universitari de la UPC. En estudis de grau, reconeixible amb 2 ECTS com a activitat d'extensió universitària.
En l'era digital, vivim envoltats de dades. Des de les xarxes socials fins a la recerca científica i les operacions comercials, cada dia generem quantitats massives d'informació.
Aquest seminari en Visualització i Anàlisi de Dades és una introducció a les eines i tècniques per a la gestió de dades a gran escala. S'utilitzarà la biblioteca de Python Pandas, es manipularan (neteja, transformació) dades estructurades utilitzant Series i DataFrames i es duran a terme anàlisis de conjunts de dades complexos. A més, s'utilitzarà PySpark i Hadoop per processar dades en un entorn distribuït.