Zum Hauptinhalt springen

Wie lese ich Excel-Dateien mit Python

Das Arbeiten mit Excel-Dateien ist in vielen Unternehmen und Organisationen eine häufige Aufgabe. Python bietet als universelle Programmiersprache mehrere Möglichkeiten zum Lesen von Daten aus Excel-Tabellen. In diesem Artikel werden wir uns mit der Pandas-Bibliothek befassen, um Daten aus Excel-Dateien in Python zu importieren.

Pandas - es ist eine leistungsstarke Datenanalysebibliothek, die praktische Tools für die Arbeit mit Tabellendaten bietet. Es ermöglicht Ihnen, Daten aus verschiedenen Formaten zu importieren, einschließlich Excel. Pandas verfügt über viele Funktionen und Methoden für die Arbeit mit Tabellen, wie zum Beispiel das Filtern, Sortieren und Aggregieren von Daten.

Um mit Excel-Dateien in Python zu beginnen, müssen Sie die Pandas-Bibliothek installieren. Dazu können Sie den pip-Paketmanager verwenden: pip install pandas. Nach der Installation von Pandas können wir seine Funktionalität verwenden, um Daten aus Excel-Dateien zu lesen und verschiedene Operationen an ihnen durchzuführen.

import pandas as pd - wir importieren die Pandas-Bibliothek unter dem Pseudonym pd, um ihre Funktionen und Methoden zu verwenden.

Excel-Dateien

Excel-Dateien haben eine Erweiterung .xlsx oder .xls und können mehrere Arbeitsblätter enthalten, von denen jedes eine separate Tabelle mit einem Dataset darstellt.

Durch das Lesen von Daten aus Excel-Dateien mit Python können Sie die Verarbeitung, Analyse und Visualisierung von Daten automatisieren. Python bietet mehrere Bibliotheken an, die die Möglichkeit bieten, mit Excel-Dateien zu arbeiten, z. B. OpenPyXL, xlrd und Pandas.

Die OpenPyXL- Bibliothek bietet Funktionen zum Lesen, Schreiben und Bearbeiten von Excel-Formatdateien .xlsx. Es ermöglicht Ihnen, mit einzelnen Zellen, Zeilen und Spalten in einer Tabelle zu arbeiten, neue Arbeitsblätter zu erstellen und Änderungen in einer Datei zu speichern.

Die xlrd-Bibliothek bietet die Möglichkeit, Daten aus Formatdateien zu lesen.xls. Es ermöglicht Ihnen, Daten aus Zellen, Zeilen und Spalten einer Tabelle zu extrahieren und mit Formatierungen und Formeln zu arbeiten.

Die Pandas-Bibliothek bietet Tools zum Analysieren und Verarbeiten von Daten, einschließlich der Möglichkeit, Excel-Dateien zu lesen und zu schreiben. Es ermöglicht Ihnen, Daten aus einer Datei in DataFrame-Objekte zu laden, bei denen es sich um datenfreundliche Strukturen handelt.

Das Lesen und Verarbeiten von Daten aus Excel-Dateien mit Python erleichtert und beschleunigt die Arbeit mit Tabellen sowie die Analyse und Visualisierung von Daten mithilfe anderer Bibliotheken wie Matplotlib und Seaborn.

Python

Python bietet viele Bibliotheken für die Arbeit mit Excel-Dateien, die das Lesen und Verarbeiten von Daten in Tabellen erleichtern. Eine der beliebtesten Bibliotheken ist Pandas , mit der Sie Daten aus Excel-Dateien lesen und als Tabelle mit ihnen arbeiten können. Dies macht es einfach, verschiedene Datenoperationen wie Filtern, Sortieren und Analysieren durchzuführen.

Im Folgenden finden Sie einen Python-Beispielcode, der die Pandas-Bibliothek zum Lesen einer Excel-Datei verwendet:

import pandas as pd# Считываем файл и сохраняем данные в переменной dataframedataframe = pd.read_excel('file.xlsx')# Выводим первые 5 строк таблицыprint(dataframe.head())

In diesem Beispiel wird zuerst die Pandas-Bibliothek importiert. Die Funktion read_excel() wird dann verwendet, um den Inhalt der Excel-Datei zu lesen und die Daten in der Variablen dataframe zu speichern. Schließlich werden die ersten 5 Zeilen der Tabelle mit der Funktion head() ausgegeben.

Python verfügt über leistungsstarke Tools zum Arbeiten mit Excel-Dateien und ist damit eine ausgezeichnete Wahl zum Lesen und Verarbeiten von Daten aus diesen Dateien. Dank seiner Einfachheit und Flexibilität können Sie mit Python schnell und effizient mit Excel-Dateien beliebiger Komplexität arbeiten.

Lesen von Excel-Dateien

1. openpyxl: Es ist eine Python-Bibliothek zum Lesen und Schreiben von Excel-Dateien. Es unterstützt Formate .xlsx und .xlsm (Excel 2007+) sowie .xltx und .xltm (Excel 2010+).

2. xlrd: Mit dieser Bibliothek können Sie Daten aus Excel-Dateien im Format lesen .xls (Excel 97-2003).

3. pandas: Diese leistungsstarke Python-Bibliothek zur Datenanalyse unterstützt das Lesen von Daten aus Excel-Dateien. Es kann mit verschiedenen Excel-Dateiformaten arbeiten, einschließlich .xlsx, .xlsm und .xls.

Um diese Bibliotheken verwenden zu können, müssen Sie sie zuerst mit einem Python-Paketmanager wie pip installieren. Anschließend können Sie die entsprechenden Module importieren und ihre Methoden zum Lesen von Daten aus Excel-Dateien verwenden.

Bibliotheken zum Lesen von Excel-Dateien

Es gibt mehrere Bibliotheken zum Lesen von Excel-Dateien mit Python. Einige von ihnen ermöglichen es Ihnen, mit Dateien in Formaten zu arbeiten .xls und .xlsx, andere spezialisieren sich nur auf einen von ihnen.

  • Openpyxl: Dies ist eine der beliebtesten Bibliotheken für die Arbeit mit Excel-Dateien im Format .xlsx. Sie ermöglicht das Öffnen und Erstellen von Dateien, das Lesen und Schreiben von Daten in Zellen. Openpyxl unterstützt eine Vielzahl von Funktionen, einschließlich Zellenformeln und Formeln.
  • Xlrd: mit dieser Bibliothek können Sie mit Formatdateien arbeiten.xls und .xlsx. Xlrd bietet eine einfache und intuitive Benutzeroberfläche zum Lesen von Daten aus Excel-Dateien. Das Schreiben von Daten in Zellen wird jedoch nicht unterstützt.
  • Pandas: Es ist eine leistungsstarke Datenanalysebibliothek, die auch zum Lesen von Excel-Dateien verwendet werden kann. Mit Pandas können Sie Daten aus Dateien importieren .xls und .xlsx bietet praktische Tools, um mit ihnen zu arbeiten, einschließlich Filtern, Sortieren und Analysieren. Sie müssen jedoch zusätzliche Abhängigkeiten installieren, um mit Pandas arbeiten zu können.

Die Auswahl einer Bibliothek zum Lesen von Excel-Dateien hängt von der jeweiligen Aufgabe und den Anforderungen ab. Openpyxl eignet sich für die Arbeit mit Dateien .xlsx, Xlrd ist für .xls und .xlsx und Pandas können nützlich sein, wenn Sie komplexe Datenanalysen durchführen müssen.

Beispielcode

Python bietet verschiedene Bibliotheken zum Lesen von Excel-Dateien, z. B. pandas und openpyxl. Im Folgenden finden Sie Codebeispiele, die veranschaulichen, wie Sie mit diesen Bibliotheken Daten aus Excel-Dateien lesen können.

Beispielcode mit der Pandas-Bibliothek:

import pandas as pd# Чтение данных из excel-файлаdata = pd.read_excel("file.xlsx")# Вывод первых 5 строк данныхprint(data.head())

Beispielcode mit der openpyxl-Bibliothek:

from openpyxl import load_workbook# Загрузка excel-файлаwb = load_workbook(filename="file.xlsx")# Получение активного листаsheet = wb.active# Чтение данных из ячеекdata = []for row in sheet.iter_rows(values_only=True):data.append(row)# Вывод данныхfor row in data:print(row)

Beide Beispiele zeigen, wie Sie Daten aus einer Excel-Datei mit Python lesen können. Wenn Sie Daten in Pandas laden, können Sie mit ihnen als Tabelle arbeiten, während die openpyxl-Bibliothek die Möglichkeit bietet, mit Daten auf einer niedrigeren Ebene zu arbeiten, beispielsweise um Werte aus einzelnen Zellen abzurufen. Je nach Ihren Bedürfnissen können Sie eine geeignete Bibliothek zum Lesen von Excel-Dateien auswählen.

Pandas-Paket

Um mit Pandas zu beginnen, müssen Sie es installieren. Dazu können Sie den Befehl verwenden:

!pip install pandas

Nach der Installation von Pandas können Sie mit der Arbeit mit Excel-Dateien beginnen. Um Daten aus einer Excel-Datei in pandas zu lesen, wird die Funktion read_excel() verwendet. Sie können den Dateipfad und andere erforderliche Parameter zum Lesen der Daten angeben.

Der folgende Code liest beispielsweise Daten aus der Datei "data.xlsx" und speichert sie in einer df-Variablen:

import pandas as pddf = pd.read_excel("data.xlsx")

Nachdem Sie die Daten in die Variable df gelesen haben, können Sie verschiedene Operationen für sie ausführen. Sie können beispielsweise die ersten Datenzeilen mit der Funktion head() ausgeben :

print(df.head())

Außerdem können Sie mit Pandas verschiedene Datenoperationen durchführen, z. B. Filtern, Gruppieren, Aggregieren und vieles mehr. Es bietet eine breite Palette von Funktionen und Methoden für die Arbeit mit Daten und ist damit ein leistungsfähiges Werkzeug zum Analysieren und Verarbeiten von Excel-Dateien.

Eine der nützlichen Funktionen von Pandas ist die Möglichkeit, Daten in eine Excel-Datei zu schreiben. Dazu wird die to_excel() -Methode verwendet. Der folgende Code speichert beispielsweise Daten aus der Variablen df in der Ausgabedatei.xlsx":

df.to_excel("output.xlsx")

Auf diese Weise erleichtert das Pandas-Paket das Lesen und Schreiben von Daten aus Excel-Dateien in Python und bietet leistungsstarke Werkzeuge, um sie zu analysieren und zu verarbeiten.