In wissenschaftlichen und statistischen Studien ist es oft notwendig, große Datenmengen zu verarbeiten. Eines der beliebtesten Tools zum Arbeiten mit Tabellendaten ist die Pandas–Bibliothek für die Programmiersprache Python.
Eines der gängigsten Datenspeicherformate ist das Excel-Format. In diesem Artikel werden wir uns ansehen, wie Daten aus einer Excel-Datei in Pandas geladen werden, insbesondere wenn Sie mit Dezimalzahlen arbeiten.
Zuerst müssen Sie die Pandas-Bibliothek und ihre Abhängigkeiten installieren:
pip install pandas
Dann können wir die Funktion verwenden read_excel um Daten aus einer Excel-Datei zu laden. Mit dieser Funktion können Sie den Dateinamen angeben und auch die Spalten und Zeilen angeben, die wir laden möchten.
Excel-Datei herunterladen
Führen Sie die folgenden Schritte aus, um eine Excel-Datei mit Dezimalzahlen in Pandas herunterzuladen:
- Installiere die Pandas-Bibliothek mit dem Befehl !pip install pandas .
- Importieren Sie die Pandas- und Numpy-Bibliotheken in Ihr Projekt:
import pandas as pdimport numpy as np
- Verwenden Sie die pd-Funktion.read_excel() zum Herunterladen einer Excel-Datei:
df = pd.read_excel('путь_к_файлу.xlsx')
Ersetzen Sie den Dateipfad durch die Datei.xlsx auf dem Pfad zu Ihrer Excel-Datei.
Wenn Sie eine Excel-Datei laden, erkennt Pandas automatisch Dezimalzahlen. Wenn Ihre Excel-Datei andere Datentypen enthält, können Sie diese mit dem dtype-Parameter der pd-Funktion angeben.read_excel() .
Wie lade ich eine Excel-Datei in Pandas hoch
Die Pandas-Bibliothek bietet praktische Werkzeuge für die Arbeit mit Excel-Daten. Das Laden von Excel-Dateien in Pandas erfolgt über die Funktion read_excel() .
Zuerst müssen Sie die Pandas-Bibliothek mit dem Befehl installieren:
pip install pandas
Sie können dann mit der Arbeit mit der Excel-Datei beginnen. Zum Laden einer Datei müssen Sie den Pfad mit dem Argument filepath angeben und die Funktion read_excel() aufrufen. Zum Beispiel:
import pandas as pdfilepath = "путь_к_файлу.xlsx"data = pd.read_excel(filepath)
Die Funktion read_excel() erkennt automatisch das Dateiformat und liest seinen Inhalt in ein DataFrame-Objekt ein, das das grundlegende Werkzeug von Pandas zum Arbeiten mit Daten ist. Wenn die Daten Dezimalzahlen enthalten, werden sie korrekt interpretiert.
Nach dem Herunterladen können Sie die Datei zum Analysieren, Ausführen von Operationen und Visualisieren von Daten verwenden. Sie können beispielsweise die ersten Datenzeilen mit der head() -Methode anzeigen :
print(data.head())
Dieser Code zeigt die ersten 5 Datenzeilen aus der heruntergeladenen Datei an.
Mit der read_excel() -Funktion und der Pandas-Bibliothek können Sie daher problemlos eine Excel-Datei mit Dezimalzahlen laden und mit der Arbeit mit den Daten in Python beginnen.
Umgang mit Dezimalzahlen in Pandas
Wenn Sie mit Daten arbeiten, die Dezimalzahlen enthalten, ist es wichtig, diese Werte in Pandas richtig zu verarbeiten. Dezimalzahlen können als Gleitkommazahlen oder als Zeichenfolgen mit einem Dezimaltrennzeichen dargestellt werden. In beiden Fällen gibt es einige Besonderheiten beim Laden und Verarbeiten von Daten.
Wenn Sie Daten aus einer Excel-Datei in Pandas laden, kann es vorkommen, dass Werte mit Dezimalzahlen als Zeichenfolgen geladen werden. Dies kann problematisch sein, wenn Berechnungen mit diesen Werten durchgeführt werden müssen.
Um Dezimalzahlen richtig zu verarbeiten, können Sie die `-Methode verwenden.astype()' und konvertiert eine Spalte mit Dezimalzahlen in ein numerisches Format. Zum Beispiel:
df['column_name'] = df['column_name'].astype(float)
Wenn die Dezimalzahlen in einer Excel-Datei mit einem Komma anstelle eines Punktes dargestellt werden, müssen Sie sie vor der Konvertierung durch Punkte ersetzen. Dazu können Sie die Methode ' verwenden.str.replace()`. Zum Beispiel:
df['column_name'] = df['column_name'].str.replace(",", ".").astype(float)
Wenn die Dezimalzahlen durch ein Semikolon anstelle eines Punktes dargestellt werden, aber bereits als Gleitkommazahlen in Pandas geladen wurden, können Sie die `-Methode verwenden.apply()` und ersetzen Sie das Komma durch einen Punkt für jeden Wert. Zum Beispiel:
df['column_name'] = df['column_name'].apply(lambda x: str(x).replace(",", ".")).astype(float)
Die Daten mit Dezimalzahlen wurden jetzt hochgeladen und können jetzt in Pandas weiterverarbeitet werden.
Anmerkung: Bei Verwendung der Methode '.astype()` oder '.apply()` Achten Sie darauf, die Genauigkeit der Dezimalzahlen nicht zu verlieren.