Documentație
Formatul CSV (eng. Comma Separated Variables, adică valori separate prin virgulă) se folosește ca o variantă simplificată a tabelelor de tip Excel. Informațiile sînt scrise pe linii, iar coloanele se separă prin virgulă. De exemplu, într-un fișier CSV putem avea:
Ceea ce este echivalent cu tabelul:
Orice separator în afara virgulei se ignoră, deci pentru lizibilitate, multe editoare folosesc spații sau tab-uri pentru separare vizuală. Deci putem scrie, de exemplu:
Preluarea datelor în Python
Putem prelua datele dintr-un fișier CSV folosind modulul csv
. Apoi, avem funcțiile reader
și writer
, care creează obiecte corespunzătoare.
Observație: Dacă primiți o eroare privitoare la modulul CSV, instalați-l în terminal, cu comanda:
Exemplu de citire:
Exemplu de scriere:
Resurse
documentația oficială a modulului
csv
este aici;un scurt tutorial, aici;
seturi de date:
data.world -- necesită cont, gratis;
datahub -- gratis;
Kaggle datasets -- necesită cont, gratis;
Google datasets -- gratis;
Direct de pe GitHub, căutați "dataset" și găsiți, de exemplu, acest repository, de la NY Times.
Last updated