Seaborn - es ist eine leistungsstarke Bibliothek zur Visualisierung von Daten in der Programmiersprache Python. Es bietet praktische Werkzeuge zum Erstellen verschiedener Diagrammtypen, einschließlich Balkendiagrammen. Ein Histogramm ist eine grafische Darstellung der Verteilung von Werten basierend auf ihrer Häufigkeit in einem bestimmten Datensatz.
Das Erstellen eines Histogramms mit seaborn ist sehr einfach. Zunächst müssen Sie die Bibliothek mithilfe des Befehls seaborn als sns importieren. Laden Sie dann die Daten herunter, mit denen Sie arbeiten möchten, und geben Sie die erforderlichen Parameter für das Histogramm an. Die Pracht von seaborn liegt in seiner Fähigkeit, automatisch die am besten geeigneten Parameter für die Datenvisualisierung auszuwählen.
Beispielcode:
import seaborn as sns
import pandas as pd
sns.histplot(data=data, x='column_name', kde=True)
Verwenden eines Parameters kde=True fügt dem Histogramm ein Diagramm zur Bewertung der Kerndichte hinzu. Dies ist nützlich für die Visualisierung fortlaufender Daten, da das Histogramm standardmäßig diskret ist und möglicherweise keine Muster in der Verteilung anzeigt.
Darüber hinaus bietet Seaborn eine Reihe von Optionen zum Anpassen des Aussehens eines Histogramms, einschließlich des Änderns des Farbschemas und des Hinzufügens von Beschriftungen zu Achsen. Dadurch können Sie professionell aussehende Grafiken erstellen, ohne viel Code schreiben zu müssen.
Was ist ein Histogramm?
Ein Histogramm besteht aus Spalten unterschiedlicher Höhe, die unterschiedliche Datenintervalle darstellen. Ein Histogramm basiert normalerweise auf diskreten Intervallen, die gleichmäßig oder ungleichmäßig sein können. Die vertikale Achse eines Histogramms stellt die Häufigkeit oder den Anteil der Werte in jedem Intervall dar, während die horizontale Achse den Wert selbst oder die Werte darstellt, durch die die Intervalle getrennt sind.
Ein Histogramm kann verwendet werden, um Fragen wie "Welche Werte werden am häufigsten in Daten gefunden?". "Wie werden die Daten verteilt?" oder "Gibt es Ausreißer in den Daten?". Es bietet einen visuellen Einblick in die Form der Datenverteilung und hilft dabei, Spitzen und Mods sowie abnormale Werte zu identifizieren.
Warum brauche ich ein Histogramm?
Oft müssen wir bei der Analyse von Daten verstehen, wie die Werte innerhalb einer Stichprobe verteilt sind. Wenn wir zum Beispiel Daten über das Einkommen von Personen haben, sind wir daran interessiert zu wissen, wie viele Personen in jedem Einkommensbereich sind. Ein Histogramm zeigt Ihnen, wie viele Werte in jedem Intervall liegen, und gibt einen Einblick in die Form der Datenverteilung.
Das Histogramm ist auch nützlich bei der Analyse von Ausreißern in Daten. Es hilft zu sehen, ob es Werte gibt, die stark von den anderen abweichen. Die Visualisierung von Emissionen mithilfe eines Histogramms kann bei der Erkennung von Anomalien oder Fehlern in den Daten helfen.
Aufgrund der Klarheit und der einfachen Wahrnehmung ist das Histogramm eines der gebräuchlichsten und effektivsten Datenanalysewerkzeuge. Mit der Seaborn-Bibliothek zum Erstellen eines Histogramms können Sie Daten schnell und einfach visualisieren und wertvolle Einblicke erhalten, um die Verteilung von Werten in einer Stichprobe zu verstehen.
Schritte zum Erstellen eines Histogramms
Um ein Histogramm mit der Seaborn-Bibliothek in Python zu erstellen, führen Sie die folgenden Schritte aus:
- Importieren Sie die benötigten Bibliotheken, einschließlich Seaborn und Pandas.
- Laden Sie Daten in einem von Pandas unterstützten Format herunter, z. B. aus einer CSV-Datei oder einer Datenbank.
- Erstellen Sie ein DataFrame-Objekt mit den geladenen Daten.
- Passen Sie die Einstellungen des Diagramms an, einschließlich Größe und Achsen.
- Verwenden Sie die Seaborn-Methode, um ein Histogramm basierend auf den ausgewählten Daten zu erstellen.
- Fügen Sie dem Diagramm die erforderlichen Beschriftungen, Titel und Legende hinzu.
Der Beispielcode zum Erstellen eines Histogramms lautet wie folgt:
import seaborn as snsimport pandas as pd# Загрузка данныхdata = pd.read_csv('data.csv')# Создание гистограммыsns.histplot(data=data, x='column_name')# Настройки графикаsns.set(style="whitegrid")plt.title("Гистограмма")plt.xlabel("Значения")plt.ylabel("Частота")# Отображение графикаplt.show()
Wenn Sie die angegebenen Schritte ausführen und die Diagrammeinstellungen anpassen, können Sie ein Histogramm erstellen, das die Verteilung der Werte der ausgewählten Variablen in den Daten widerspiegelt. Dies wird Ihnen helfen, die Daten zu analysieren und ihre Struktur und Merkmale zu verstehen.
Schritt 1. Installieren der Seaborn-Bibliothek
Bevor Sie mit der Erstellung von Histogrammen mit der Seaborn-Bibliothek beginnen, müssen Sie sie auf Ihrem Computer installieren. Dazu können Sie den pip-Paketmanager verwenden, der bereits mit Python installiert ist.
- Öffnen Sie eine Eingabeaufforderung oder ein Terminal auf Ihrem Computer.
- Geben Sie den folgenden Befehl ein, um seaborn zu installieren:
pip install seaborn - Warten Sie, bis die Installation abgeschlossen ist.
Nachdem Sie die Seaborn-Bibliothek erfolgreich installiert haben, können Sie damit beginnen, Histogramme und andere Diagramme in Ihren Python-Projekten zu erstellen.
Schritt 2. Erforderliche Module importieren
Bevor Sie ein Histogramm mit der Seaborn-Bibliothek erstellen können, müssen Sie mehrere Module importieren. Zuerst brauchen wir die Seaborn-Bibliothek selbst. Zweitens werden wir das Numpy-Modul verwenden, um mit Datenarrays zu arbeiten. Schließlich importieren wir das matplotlib-Modul.pyplot, mit dem wir Grafiken anzeigen können.
Zuerst installieren wir alle notwendigen Module:
!pip install seaborn numpy matplotlib
Jetzt importieren wir die Module:
import seaborn as snsimport numpy as npimport matplotlib.pyplot as plt
Jetzt haben wir alles bereit, um ein Histogramm mit seaborn zu erstellen.
Schritt 3. Herunterladen von Daten
Bevor Sie mit der Erstellung eines Histogramms mit der Seaborn-Bibliothek beginnen, müssen Sie die Daten laden, auf denen das Histogramm basiert.
Die Daten können in verschiedenen Formaten dargestellt werden, z. B. als CSV-Datei (Comma-Separated Values). In diesem Fall können Sie die Funktion read_csv des Moduls verwenden pandas, um die Daten als Tabelle zu laden.
Beispiel für das Herunterladen von Daten aus einer CSV-Datei:
| Titel | Typ | Die Beschreibung |
|---|---|---|
| data | DataFrame | Tabelle mit geladenen Daten |
import pandas as pd
# Laden von Daten aus einer CSV-Datei
Nachdem Sie die Daten als Tabelle geladen haben, können Sie mit der Seaborn-Bibliothek beginnen, ein Histogramm zu erstellen.
Schritt 4. Erstellen eines Histogramms
Um ein Histogramm zu erstellen, verwenden wir die Funktion distplot() der Seaborn-Bibliothek. Mit dieser Funktion können Sie die Verteilung der Daten visualisieren und ein Histogramm basierend auf der angegebenen Spalte erstellen.
Beispiel für die Verwendung der Funktion distplot() :
import seaborn as snssns.distplot(data['column_name'])
In diesem Beispiel übergeben wir den Spaltennamen column_name als Argument an die Funktion distplot(), um ein Histogramm basierend auf den Daten aus dieser Spalte zu erstellen.
Mit der Funktion distplot() können Sie auch Histogrammparameter wie Farbe, Spaltenbreite usw. anpassen. Diese Einstellungen können als Argumente an eine Funktion übergeben werden.
Nachdem der Code ausgeführt wurde, wird das Histogramm angezeigt. Sie besteht aus Spalten, die jeweils einen bestimmten Wertebereich darstellen. Die Höhe jeder Spalte entspricht der Anzahl der Werte aus diesem Intervall.
Ein Histogramm ermöglicht es Ihnen, die Verteilung der Daten schnell zu bewerten und Merkmale wie Mods oder Ausreißer aufzudecken. Außerdem können Sie die Verteilung verschiedener Datenspalten vergleichen und die Abhängigkeitsanalyse zwischen ihnen durchführen.
Das Erstellen eines Histogramms mit der Seaborn-Bibliothek ist eine einfache und bequeme Möglichkeit, Daten mit Python zu visualisieren.
Schritt 5. Anpassen des Aussehens eines Histogramms
Nachdem wir ein grundlegendes Histogramm mit der Seaborn-Bibliothek erstellt haben, können Sie das Erscheinungsbild anpassen, um das Diagramm klarer und attraktiver zu gestalten.
In der Seaborn-Bibliothek stehen viele Parameter zur Verfügung, mit denen Sie verschiedene Aspekte eines Histogramms ändern können. Im Folgenden sind einige der am häufigsten verwendeten Optionen aufgeführt:
- color : Die Farbe der Säulen des Histogramms.
- linewidth : Die Stärke der Spaltenlinien.
- edgecolor : Die Farbe der Spaltenränder.
- alpha : Spaltentransparenz.
- histtype : Der Typ des Histogramms (z. B. "bar" für ein Säulen-Histogramm, "step" für ein Säulen-Histogramm in Schritten usw.).
Lassen Sie uns zum Beispiel die Farbe der Histogrammspalten in Grün ändern und die Spaltenränder in Schwarz hinzufügen:
import seaborn as sns
import matplotlib.pyplot as plt
sns.histplot(data=df, x='column_name', color='green', edgecolor='black') plt.show()
Daher haben wir mit den Parametern color='green' und edgecolor='black' die Farbe grün für die Säulen des Histogramms und die Farbe schwarz für ihre Grenzen festgelegt.
Sie können auch andere Einstellungen ändern, um die gewünschte Histogrammansicht zu erreichen. Experimentieren Sie mutig mit verschiedenen Parameterwerten, um ein optimales Ergebnis zu erzielen.
Jetzt wissen Sie, wie Sie das Aussehen eines Histogramms mit der Seaborn-Bibliothek anpassen können. Dies wird dazu beitragen, Ihren Zeitplan ästhetisch ansprechender und informativer zu gestalten.