Ottieni una forte presa su Data Science con Python senza pubblicità completamente offline
La scienza dei dati è il processo che deriva dalla conoscenza e dalle intuizioni di una vasta e diversificata serie di dati attraverso l'organizzazione, l'elaborazione e l'analisi dei dati. Coinvolge molte discipline diverse come la modellazione matematica e statistica, l'estrazione di dati dalla sua fonte e l'applicazione di tecniche di visualizzazione dei dati. Spesso comporta anche la gestione di tecnologie di big data per raccogliere dati strutturati e non strutturati. Di seguito vedremo alcuni scenari di esempio in cui viene utilizzata la scienza dei dati.
Capitoli inclusi
Introduzione alla scienza dei dati
Impostazione dell'ambiente data science
Pandas
numpy
matplotlib
Operazioni sui dati
Pulizia dei dati
Elaborazione dei dati CSV
Elaborazione di dati JSON
Elaborazione di dati XLS
Database relazionali
Database NoSQL
Data e ora
Wrangling dei dati
Aggregazione dei dati
Lettura di pagine HTML
Elaborazione di dati non strutturati
tokenizzazione delle parole
Stemming e Lemmatization
Proprietà del grafico
Stile grafico
Diagrammi a scatola
Mappe di calore
Grafici a dispersione
Grafici a bolle
Grafici 3D
Serie storiche
Dati geografici
Dati del grafico
Misurazione della tendenza centrale
Misurare la varianza
Distribuzione normale
Distribuzione binomiale
Distribuzione di Poisson
Distribuzione Bernoulli
P-Valore
Correlazione
Test chi-quadro
Regressione lineare