So lesen, schreiben und analysieren Sie CSV in Python

So lesen, schreiben und analysieren Sie CSV in Python

Haben Sie jemals Informationen zwischen den Programmen austauschen, außer die Variablen zu verwenden?? Haben Sie jemals gedacht oder empfunden, eine Textdatei zu haben, um Daten zwischen den Programmen auszutauschen? Kennen Sie die Idee, Daten/Informationen in eine externe Datei zu speichern und sie später zu extrahieren, wenn dies erforderlich ist? Ja, wir können Daten zwischen den Programmen mit dem als CSV bezeichneten Dateiformat speichern und übertragen.

Was ist eine CSV -Datei?

Eine CSV -Datei ist eine Art von Datei, mit der Daten in einem strukturierten tabellarischen (Zeilen/Spalten-) Formular gespeichert werden. Es handelt.

In diesem Beitrag werden wir eine detaillierte Diskussion über das Lesen, Schreiben und Parsen einer CSV -Datei in Python führen.

Herkunft der CSV -Datei

Das Konzept, eine CSV -Datei zu haben, wurde von der Notwendigkeit des Exportierens großer Datenmengen von einem Ort zum anderen (Programme) benötigt (Programme). Zum Beispiel zum Importieren großer Tabellenkalkulationsdaten und des Exportierens in eine Datenbank. In ähnlicher Weise können wir große Datenmengen in die Programme exportieren.

Unterschiedliche Sprachen verwenden unterschiedliche Formate, um Daten zu speichern. Wenn die Programmierer Daten von einem Programm in ein anderes exportieren müssen, waren sie der Ansicht, dass sie eine Art universeller Dateityp verwenden müssen, den wir großen Datenmengen übertragen können. Ein Dateityp, den jedes Programm lesen und in sein eigenes Format analysieren kann.

Verstehen Sie die Struktur einer CSV -Datei

Die Struktur der CSV -Datei sieht ungefähr so ​​aus:

Spalte 1, Spalte 2, Spalte 3 Wert 1, Wert 2, Wert 3…,…,… 

Genau wie wir Spalten und Zeilen in der Datenbank haben:

Oder in tabellarischen Tabellenkalkulationsdaten:

In ähnlicher Weise ist eine CSV -Datei ein einfacher Text -Dateityp, bei dem die Daten in Form von Teilen gespeichert werden, die von einem Komma getrennt sind:

Jede Spalte ist durch ein Komma getrennt, und jede Zeile befindet sich in einer neuen Zeile.

Okay, nach dem Verständnis des Kernkonzepts, der Herkunft und der Struktur der CSV -Datei lernen wir, CSV in Python zu lesen, zu schreiben und zu analysieren.

Lesen einer CSV -Datei in Python

Zum Analysieren von CSV-Dateien haben wir zum Glück eine integrierte CSV-Bibliothek von Python zur Verfügung. Die CSV -Bibliothek ist wirklich einfach zu bedienen und kann sowohl zum Lesen als auch zum Schreiben in eine CSV -Datei verwendet werden. Beginnen wir mit dem Lesen einer CSV -Datei.

Zum Lesen einer CSV -Datei wird das Leserobjekt verwendet. Lassen Sie uns den Code zum Lesen der CSV-Datei schreiben und in einer schrittweisen Prozedur verstehen:

Lesen einer CSV

Zunächst müssen wir das CSV -Modul importieren:

CSV importieren 

Nach dem Import des CSV -Moduls können wir es jetzt in unserem Python -Programm verwenden.

Als nächstes müssen wir die CSV -Datei mithilfe von Open () im Lesemodus öffnen:

mit offenem ('Studenten.CSV ',' r ') als CSVFile 

Erstellen Sie nach dem Lesen der CSV -Datei ein CSV -Leserobjekt:

csvReader = csv.Leser (CSVFile) 

Da Comma der Standard -Trennzeichen ist, müssen wir es also nicht ausdrücklich erwähnen. Andernfalls müssen wir den von der CSV -Datei verwendeten Trennzeichen bereitstellen.

Verwenden Sie zum Extrahieren jeder Reihe die für die Schleife, um über die zu iterieren CSVReader Objekt und drucken Sie sie aus:

Für Schüler in CSVReader: Druck (Student) 

Alles in allem sieht der endgültige Code so aus:

CSV mit offenen ('Studenten importieren.csv ',' r ') als csvFile csvReader = csv.Leser (CSVFile) für Schüler in CSVReader: Print (Student)
12345CSVWith Open importieren ('Studenten.csv ',' r ') als csvFile csvReader = csv.Leser (CSVFile) für Schüler in CSVReader: Print (Student)

Sobald der Code geschrieben wurde, führen Sie den Code aus und Sie haben die gesamte CSV -Datei in das Array von Python analysiert:

Lesen einer CSV -Datei mit einem benutzerdefinierten Trennzeichen

Um eine CSV -Datei mit einem benutzerdefinierten Trennzeichen zu lesen, müssen wir den Trennzeichen beim Lesen und Erstellen eines CSV -Leserobjekts nur erwähnen.

Zum Beispiel, wenn wir ein Semikolon (;) an die Stelle eines Kommas in den Studenten legen.CSV:

Und möchten die CSV -Datei basierend auf dem Semikolon lesen, dann würde der Trennzeichen erwähnt:

csvReader = csv.Leser (CSVFILE, DELIMiter = ';') 

Der endgültige Code mit dem spezifischen Trennzeichen sieht folgendermaßen aus:

CSV mit offenen ('Studenten importieren.csv ',' r ') als csvFile csvReader = csv.Leser (CSVFile, Delimiter = ';') für Schüler in CSVReader: Print (Student)
12345CSVWith Open importieren ('Studenten.csv ',' r ') als csvFile csvReader = csv.Leser (CSVFile, Delimiter = ';') für Schüler in CSVReader: Print (Student)

Die Ausgabe ist übereinstimmend wie im vorherigen Beispiel:

So können wir einen benutzerdefinierten Trennzeichen bereitstellen und die CSV -Datei in Python lesen. Lassen Sie uns nun lernen, eine CSV -Datei in Python zu schreiben.

Schreiben einer CSV -Datei in Python

Zum Schreiben einer CSV -Datei wird das Autor -Objekt verwendet. Es kann zwei Möglichkeiten geben, eine CSV -Datei zu schreiben:

  • Schreiben Sie Zeilen eins nach dem anderen mit der Funktion writerow ()
  • Schreiben Sie mehrere Zeilen mit der Funktion writherows ()

Lassen Sie uns den Code zum Schreiben der CSV -Datei schreiben und in beide Richtungen besser verstehen:

So schreiben Sie eine CSV -Datei mithilfe von writerow () in Python

Durch die Verwendung dessen writerow () Funktion können wir nur eine Zeile gleichzeitig in einer CSV -Datei schreiben.

Zum Beispiel drei Zeilen in einen neuen Mitarbeiter schreiben.CSV -Datei, die Python wird so gehen:

CSV mit offenen (Angestellten importieren.csv ',' w ') als csvFile: writer = csv.Schriftsteller (CSVFile) Schriftsteller.writerow (["id", "Name", "Alter"]) Schriftsteller.Schriftsteller ([1, "John", 35]) Schriftsteller.Writerow ([2, "Harry", 25])
123456CSVWith Open importieren ('Mitarbeiter.csv ',' w ') als csvFile: writer = csv.Schriftsteller (CSVFile) Schriftsteller.writerow (["id", "Name", "Alter"]) Schriftsteller.Schriftsteller ([1, "John", 35]) Schriftsteller.Writerow ([2, "Harry", 25])

Der obige Code erstellt eine Datei mit dem Namen der Mitarbeiter.CSV und fügen Sie diesen Mitarbeitern drei Zeilen hinzu.CSV -Datei.

Diese Methode wird jedoch ineffizient, wenn wir Hunderte von Zeilen hinzufügen müssen. In solchen Fällen müssen wir jede Zeile eins nach dem anderen hinzufügen, was zu einem hektischen Job wird. Für die Lösung dieses Problems bietet Python auch a writorows () Funktionieren Sie zahlreiche Zeilen gleichzeitig in eine CSV -Datei.

Schreiben Sie mehrere Zeilen mit der Funktion writherows ()

Durch Verwendung der writorows () Funktion können wir einfach eine Array von Arrays (Zeilen) für die Funktion writherows () bereitstellen und alle Zeilen in die CSV -Datei fügen.

Zum Beispiel drei Zeilen in einen Mitarbeiter schreiben.CSV -Datei erstellen wir zunächst ein Array mit dem Namen von "Mitarbeiter.CSV ” die Zeilen in Form von Array -Elementen enthält und dann die bereitstellen "Mitarbeiter.CSV ” Array zur Funktion writorows ().

Alles in allem wird der Python so gehen:

Importieren Sie CSV Employees_csv = [["ID", "Name", "Age"], [1, "John", 35], [2, "Harry", 25] mit offenen (Angestellten.csv ',' w ') als csvFile: writer = csv.Schriftsteller (CSVFile) Schriftsteller.Writerow (Mitarbeiter.CSV)
12345Importieren Sie CSVEMPOTORE_CSV = ["ID", "Name", "Age"], [1, "John", 35], [2, "Harry", 25] mit offenen (Angestellten.csv ',' w ') als csvFile: writer = csv.Schriftsteller (CSVFile) Schriftsteller.Writerow (Mitarbeiter.CSV)

Der obige Code erstellt eine Datei mit dem Namen der Mitarbeiter.CSV und fügen Sie diesen Mitarbeitern drei Zeilen hinzu.CSV -Datei wie für die frühere Prozedur.

Durch die Verwendung dieser Methode können Sie der CSV -Datei Tausende von Zeilen in kürzester Zeit hinzufügen, indem Sie die Daten in Form von Arrays bereitstellen.

Abschluss

CSV ist ein Datenformat, mit dem Daten in einem tabellarischen Format gespeichert und zwischen verschiedenen Anwendungen übertragen werden können. Python verfügt über ein integriertes Modul, mit dem der Code CSV-Daten lesen, schreiben und analysieren kann.

In diesem Beitrag haben wir gelernt, Daten in Form einer CSV -Datei mit Python zu lesen und zu schreiben.