Zum Hauptinhalt springen

Excel-Kriterium von Kolmogorov-Smirnov: Berechnung, Anwendung, Beispiele

Das Kolmogorova-Smirnova-Kriterium ist ein statistischer Test, mit dem Sie überprüfen können, wie gut einige Daten einer Verteilung entsprechen. Es basiert auf der Entfernung von Kolmogorov zwischen der empirischen Verteilungsfunktion und der theoretischen Verteilungsfunktion. In Excel wird dieses Kriterium in der Datenanalyse dargestellt.

Die Berechnung des Kolmogorov-Smirnov-Kriteriums in Excel umfasst zwei Schritte. Im ersten Schritt müssen Sie die Daten vorbereiten, indem Sie sie in einer Spalte platzieren. Dann wird die Funktion KSTEST eingeführt.Der VALUE, an den diese Datenspalte übergeben wird, und die zu überprüfende Verteilung.

Ein Beispiel:

Angenommen, Sie haben ein Dataset, dessen Verteilung Sie überprüfen möchten. Platzieren Sie dieses Dataset in einer Spalte. Angenommen, Sie haben 100 Werte in Spalte A. Um das Kolmogorov-Smirnov-Kriterium für diese Daten zu berechnen, geben Sie die Formel ein: =KSTEST.VALUE(A1:A100,"normal")

Nach der Funktion KSTEST.Der VALUE ist abgeschlossen und gibt den Wert des Kolmogorov-Smirnov-Kriteriums für den gegebenen Datensatz und die angegebene Verteilung zurück. Der Wert des Kriteriums muss größer oder gleich einer Signifikanzstufe sein, damit festgestellt werden kann, dass die beobachteten Daten der Verteilung entsprechen. Wenn der Kriterienwert kleiner als der Signifikanzwert ist, bedeutet dies, dass die Daten nicht mit der ausgewählten Verteilung übereinstimmen.

Berechnung des Kolmogorov-Smirnov-Kriteriums in Excel: Highlights

In Excel können Sie das Kolmogorov-Smirnov-Kriterium mithilfe der KSTEST-Funktion berechnen.

  • Zuerst müssen Sie die Datenspalten angeben, für die der Test ausgeführt werden soll.
  • Geben Sie dann in der Eingabezelle der Formel =KSTEST ein (Verweis auf erste Spalte, Verweis auf zweite Spalte).
  • Drücken Sie die Eingabetaste, um die Berechnung durchzuführen.

Die Testergebnisse in Excel enthalten den Wert der Kolmogorov-Smirnov-Statistik (D) und den entsprechenden p-Wert (P). Wenn der p-Wert kleiner als der Signifikanzwert ist (normalerweise 0,05), wird die Zustimmungs- oder Meinungsverschiedenhypothese zugunsten einer alternativen Hypothese abgelehnt.

Zusätzlich bietet Excel auch eine KSTEST-Funktion.2T, mit dem Sie zwei Stichproben unabhängig von der Stichprobengröße vergleichen können.

Es ist wichtig zu beachten, dass die Ergebnisse des Kolmogorov-Smirnov-Kriteriums nur zum Vergleich von eindimensionalen kontinuierlichen Verteilungen interpretiert werden können. Für diskrete Verteilungen oder mehrdimensionale Fälle können andere statistische Tests geeigneter sein.

Die Verwendung des Kolmogorov-Smirnov-Kriteriums in Excel erleichtert das Analysieren von Daten und das Vergleichen von Stichproben. Mit diesem Test können Sie feststellen, wie stark sich die beiden Stichproben unterscheiden und Rückschlüsse auf die Unterschiede oder Ähnlichkeiten zwischen ihnen ziehen.

Welche Daten können anhand des Kolmogorov-Smirnov-Kriteriums analysiert werden?

Das Kolmogorov-Smirnov-Kriterium kann verwendet werden, um verschiedene Arten von Daten zu analysieren, einschließlich:

  • Quantitative Daten: Dies sind Daten, die gemessen oder gezählt werden können, z. B. Gewicht, Größe, Zeit, Schätzungen usw. Das Kolmogorov-Smirnov-Kriterium kann helfen festzustellen, ob zwei Messmuster die gleichen Verteilungen aufweisen, was zum Vergleich der Ergebnisse verschiedener Probandengruppen oder unterschiedlicher Messmethoden nützlich sein kann.
  • Diskrete Daten: dies sind Daten, die nur bestimmte Werte annehmen, z. B. die Anzahl gefallener Abonnenten für jeden Wochentag, die Anzahl der Verkäufe für jeden Monat usw. Das Kolmogorov-Smirnov-Kriterium kann verwendet werden, um die Verteilung dieser Art von Daten zu vergleichen.
  • Kategoriale Daten: dies sind Daten, die Werte aus einer Reihe von Kategorien oder Gruppen annehmen können, z. B. Produkttypen, Farben, Geschlecht, Religion usw. Das Kolmogorov-Smirnov-Kriterium kann helfen festzustellen, ob es einen statistischen Unterschied bei der Verteilung solcher Daten zwischen zwei oder mehr Gruppen gibt.

Im Allgemeinen kann das Kolmogorov-Smirnov-Kriterium für alle Daten nützlich sein, bei denen die Hypothese über die Gleichheit der Verteilungen zweier Stichproben überprüft werden muss. Es wird häufig in der wissenschaftlichen Forschung, Datenanalyse, Marketing, Finanzen und anderen Bereichen verwendet, in denen Datenverteilungen verglichen werden müssen.

Wie verwende ich das Kriterium von Kolmogorov-Smirnov, um die Hypothese zu überprüfen?

Das Verfahren zur Verwendung des Kolmogorov-Smirnov-Kriteriums zur Überprüfung der Hypothese besteht aus den folgenden Schritten:

  1. Formulierung von Null- und Alternativhypothesen. Die Nullhypothese legt nahe, dass die beobachteten Daten einer gegebenen theoretischen Verteilung entsprechen, während die alternative Hypothese das Gegenteil behauptet.
  2. Definition des Signifikanzniveaus. Die Signifikanzstufe bestimmt die Wahrscheinlichkeit eines Fehlers der ersten Art, dh die Wahrscheinlichkeit, dass eine Nullhypothese abgelehnt wird, wenn sie tatsächlich korrekt ist. Normalerweise wird der Signifikanzgrad im Voraus gewählt, z. B. 0,05 oder 0,01.
  3. Berechnung der Statistik des Kriteriums von Kolmogorov-Smirnov. Dazu ist es notwendig, die Abweichung zwischen der empirischen Verteilungsfunktion und der theoretischen Verteilungsfunktion zu berechnen.
  4. Definieren eines kritischen Werts. Der kritische Wert wird basierend auf der ausgewählten Signifikanzstufe und Stichprobengröße ermittelt. Wenn der Wert der Kriterienstatistik größer oder gleich dem kritischen Wert ist, wird die Nullhypothese abgelehnt.
  5. Schlussfolgerungen ziehen und die Ergebnisse interpretieren. Wenn die Nullhypothese nicht abgelehnt wird, kann daraus geschlossen werden, dass die beobachteten Daten einer gegebenen theoretischen Verteilung entsprechen. Andernfalls können Sie daraus schließen, dass die Daten nicht mit dieser Verteilung übereinstimmen.

Ein Beispiel für die Verwendung des Kolmogorov-Smirnov-Kriteriums zur Überprüfung der Hypothese könnte wie folgt sein: Angenommen, wir haben eine Stichprobe von 50 Beobachtungen und wir gehen davon aus, dass diese Stichprobe der Normalverteilung entspricht. Die Nullhypothese ist, dass die Stichprobe der Normalverteilung entspricht, und die alternative Hypothese behauptet das Gegenteil. Wir wählen einen Signifikanzwert von 0,05 aus.

Nachdem wir die Statistik des Kolmogorov-Smirnov-Kriteriums berechnet und einen kritischen Wert ermittelt haben, vergleichen wir den Wert der Statistik mit dem kritischen Wert. Wenn der Wert der Statistik kleiner oder gleich dem kritischen Wert ist, wird die Nullhypothese nicht abgelehnt, und wir können daraus schließen, dass die Stichprobe der Normalverteilung entspricht. Wenn der Wert der Statistik größer als der kritische Wert ist, wird die Nullhypothese abgelehnt, und wir schließen daraus, dass die Stichprobe nicht mit der Normalverteilung übereinstimmt.

Daher ist das Kolmogorov-Smirnov-Kriterium ein nützliches Werkzeug zur Überprüfung von Hypothesen über die Übereinstimmung von Daten mit einer bestimmten Verteilung und kann in einer Vielzahl von statistischen Studien und Datenanalysen verwendet werden.

Beispiele für die Berechnung des Kolmogorov-Smirnov-Kriteriums in Excel

Es gibt eine spezielle KSTEST-Funktion, um das Kriterium in Excel zu berechnen. Beispiele für die Verwendung dieser Funktion zeigen Ihnen, wie das Kolmogorov-Smirnov-Kriterium in Excel berechnet und angewendet wird.

Beispiel 1:

  1. Angenommen, wir haben zwei Stichproben von Daten: A und B. Lassen Sie uns überprüfen, ob es einen statistischen Unterschied zwischen den beiden gibt, indem Sie das Kolmogorov-Smirnov-Kriterium verwenden.
  2. Geben Sie in Zelle A1 die erste Stichprobe der Daten ein, z. B.: 1, 2, 3, 4, 5.
  3. Geben Sie in Zelle B1 eine zweite Datenprobe ein, z. B.: 6, 7, 8, 9, 10.
  4. Geben Sie in Zelle C1 die Formel ein: =KSTEST(A1:A5, B1:B5).
  5. Drücken Sie die Eingabetaste, um die Berechnung durchzuführen.

Wenn Sie diese Formel ausführen, wird in Zelle C1 ein Wert für die p-Signifikanzebene angezeigt, der die statistische Differenz zwischen den Stichproben ableitet. Wenn der Wert der Signifikanzstufe p kleiner ist als die angegebene Signifikanzstufe (normalerweise 0,05), kann daraus eine statistische Signifikanz abgeleitet werden.

Beispiel 2:

  1. Angenommen, wir haben eine Datenprobe und möchten überprüfen, ob diese Daten mit einer bestimmten theoretischen Verteilung übereinstimmen.
  2. Geben Sie in Zelle A1 eine Stichprobe von Daten ein, z. B.: 1, 2, 3, 4, 5.
  3. Geben Sie in Zelle B1 die Formel ein: =KSTEST(A1:A5, NORM.DIST(A1, AVERAGE(A1:A5), STDEV(A1:A5), TRUE)).
  4. Drücken Sie die Eingabetaste, um die Berechnung durchzuführen.

Durch die Ausführung dieser Formel wird in Zelle B1 ein Wert für die p-Signifikanzebene ausgegeben, der eine Schlussfolgerung zur Übereinstimmung der Daten mit der theoretischen Verteilung ermöglicht. Wenn der Wert der p-Signifikanzstufe kleiner ist als die angegebene Signifikanzstufe (normalerweise 0,05), können Sie daraus schließen, dass die Daten der Verteilung entsprechen.

Dies sind nur Beispiele für die Verwendung der KSTEST-Funktion in Excel, um das Kolmogorov-Smirnov-Kriterium zu berechnen und anzuwenden. Abhängig von der spezifischen Aufgabe und den Anforderungen für die Datenanalyse können andere Excel-Methoden und -Funktionen verwendet werden.

Wie interpretiere ich die Ergebnisse des Kolmogorov-Smirnov-Kriteriums?

Die diagnostischen Statistiken von Kolmogorov-Smirnov stellen die größte Abweichung zwischen der empirischen Verteilungsfunktion (ECDF) einer Stichprobe und der Verteilungsfunktion dar, die als theoretische Verteilung verwendet wird. Als Ergebnis des Tests werden die resultierenden diagnostischen Statistiken mit einem kritischen Wert verglichen, der dem ausgewählten Signifikanzniveau entspricht.

der p-Wert, der durch den Test erhalten wird, ist wahrscheinlich, eine solche oder noch extremere diagnostische Statistik zu erhalten, vorausgesetzt, die Nullhypothese ist korrekt. Wenn der p-Wert kleiner als die ausgewählte Signifikanzstufe ist, lehnen wir die Nullhypothese zugunsten einer alternativen Hypothese ab, die vorsieht, dass die Daten nicht mit der ausgewählten theoretischen Verteilung übereinstimmen. Wenn der p-Wert größer als der Signifikanzwert ist, haben wir nicht genügend Gründe, die Nullhypothese abzulehnen.

Die Interpretation der Ergebnisse des Kolmogorov-Smirnov-Kriteriums sollte auf der gewählten Signifikanzebene basieren. Wenn der p-Wert kleiner als der Signifikanzwert ist, können wir daraus schließen, dass die Stichprobe nicht mit der ausgewählten theoretischen Verteilung übereinstimmt. In diesem Fall können wir die Gründe für die Abweichung untersuchen und diese Informationen bei der weiteren Analyse der Daten verwenden. Wenn der p-Wert größer als der Signifikanzwert ist, haben wir keinen Grund, die Nullhypothese aufzugeben, und wir können davon ausgehen, dass die Stichprobe der ausgewählten theoretischen Verteilung entspricht.