English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

NumPy 统计函数

numpy.amin() und numpy.amax()

numpy.amin() wird verwendet, um den kleinsten Wert der Elemente eines Arrays entlang eines bestimmten Achse zu berechnen.
numpy.amax() wird verwendet, um den größten Wert der Elemente eines Arrays entlang eines bestimmten Achse zu berechnen.

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Unser Array ist:', a)
 print('Aufruf der Funktion amin():', np.amin(a,1))
 print('Aufruf der Funktion amin() wieder:', np.amin(a, 0))
 print('Aufruf der Funktion amax():', np.amax(a))
 print('Aufruf der Funktion amax():', np.amax(a, axis=0))

输出结果为:

 Unser Array ist: [[3 7 5])
  [8 4 3])
  [2 4 9]
 Aufruf der Funktion amin(): [3 3 2])
 Aufruf der Funktion amin() wieder: [2 4 3])
 Aufruf der Funktion amax(): 9
 Aufruf der Funktion 'amax()' erneut: [8 7 9])

numpy.ptp()

Die Funktion 'numpy.ptp()' berechnet den Unterschied zwischen dem Maximum und dem Minimum der Elemente im Array (Maximum) - Minimum).

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print ('Aufruf der Funktion 'ptp()':', np.ptp(a))
 print('Entlang der Achse 1 Aufruf der Funktion 'ptp()':', np.ptp(a, axis = 1))
 print ('Aufruf der Funktion 'ptp()' entlang der Achse 0:', np.ptp(a, axis = 0))

输出结果为:

 Aufruf der Funktion 'ptp()': 7
 Entlang der Achse 1 Aufruf der Funktion 'ptp()': [4 5 7])
 Aufruf der Funktion 'ptp()' entlang der Achse 0: [6 3 6])

numpy.percentile()

Die Quotile sind in der Statistik verwendete Maße, die den Prozentsatz der Beobachtungen darstellen, die kleiner sind als dieser Wert. Die Funktion 'numpy.percentile()' akzeptiert die folgenden Parameter.

numpy.percentile(a, q, axis)

Parameterbeschreibung:

a: Das Eingangsarray q: Der zu berechnende Quotil, in 0 ~ 100 zwischen axis: Die Achse entlang derer die Quotile berechnet werden

Zunächst definieren wir die Quotile:

Der p-te Quotil ist ein solcher Wert, der mindestens p% der Datenpunkte kleiner oder gleich diesem Wert sind und mindestens (100-p)% der Datenpunkte diesen Wert oder höher erreichen.
Ein Beispiel: Die Einstufungstests für die Aufnahme an Hochschulen werden oft in Form von Quotilen gemeldet. Zum Beispiel, wenn ein Kandidat im Einstufungstest für den chinesischen Fachbereich eine ursprüngliche Punktzahl von 54 Punkte. Es ist nicht leicht zu wissen, wie gut der Schüler im Vergleich zu anderen Teilnehmern desselben Tests abschneidet. Wenn jedoch die ursprünglichen Noten54Punkte genau der70百分位数,können wir erfahren70% der Schüler eine niedrigere Punktzahl, während etwa30% der Schüler eine höhere Punktzahl.

Hierbei beträgt p = 70。

 import numpy as np 
 a = np.array([[10, 7, 4, [3, 2, 1])
 # 50% der Quotile, ist der Median der sortierten Werte in 'a'
 print ('Aufruf der Funktion 'percentile()': 50)) 
 # axis wird 0, in der Spalte berechnet
 print (np.percentile(a, 50, axis=0)) 
 # axis wird 1,在横行上求
 print (np.percentile(a, 50, axis=1)) 
 # Dimensionen beibehalten
 print (np.percentile(a, 50, axis=1, keepdims=True))

输出结果为:

 Aufruf der Funktion 'percentile()': 3.5
 [6.5 4.5 2.5])
 [7. 2.]
 [[7.]
 [2.]]

numpy.median()

Die Funktion 'numpy.median()' wird verwendet, um den Median (Medianwert) der Elemente im Array 'a' zu berechnen

 import numpy as np 
 a = np.array([[30,65,70],[80,95,10],[50,90,60]]) 
 Aufruf der Funktion 'median()': (np.median(a))
 print('Entlang der Achse 0 Aufruf der Funktion median():', np.median(a, axis=0))
 print('Entlang der Achse 1 Aufruf der Funktion median():', np.median(a, axis= 1))

输出结果为:

 Aufruf der Funktion median(): 65.0}
 Entlang der Achse 0 Aufruf der Funktion median(): [50. 90. 60.]
 Entlang der Achse 1 Aufruf der Funktion median(): [65. 80. 60.]

numpy.mean()

Die Funktion numpy.mean() gibt den arithmetischen Durchschnitt der Elemente eines Arrays zurück. Wenn ein Achsenparameter bereitgestellt wird, wird entlang dieser Achse berechnet.
Der arithmetische Durchschnitt ist das Verhältnis der Summe der Elemente entlang der Achse zur Anzahl der Elemente.

 import numpy as np 
 a = np.array([[1,2,3],[3,4,5],[4,5,6]) 
 print('Aufruf der Funktion mean():', (np.mean(a))
 print('Entlang der Achse 0 Aufruf der Funktion mean():', np.mean(a, axis=0))
 print('Entlang der Achse 1 Aufruf der Funktion mean():', np.mean(a, axis= 1))

输出结果为:

 Aufruf der Funktion mean():3.6666666666666665
 Entlang der Achse 0 Aufruf der Funktion mean(): [2.66666667 3.66666667 4.66666667])
 Entlang der Achse 1 Aufruf der Funktion mean(): [2. 4. 5.]

numpy.average()

Die Funktion numpy.average() berechnet den gewichteten Durchschnitt der Elemente eines Arrays basierend auf den jeweiligen Gewichten in einem anderen Array.
Diese Funktion kann einen Achsenparameter akzeptieren. Wenn keine Achse angegeben ist, wird das Array ausgebreitet.<
Der gewichtete Durchschnitt multipliziert jede Zahl mit dem entsprechenden Gewichtungsfaktor, addiert die Summe und teilt sie durch die Gesamtzahl der Einheiten.
Beachten Sie das Array [1,2,3,4], und die entsprechenden Gewichte [4,3,2,1], durch das Hinzufügen der Produkte der entsprechenden Elemente und durch Division des Summens durch die Summe der Gewichte berechnet.

Gewichteter Durchschnitt = (1*4+2*3+3*2+4*1])/(4+3+2+1])
 import numpy as np 
 a = np.array([1,2,3,4]) 
 print('Aufruf der average() Funktion:', np.average(a))
 # Ohne angegebene Gewichte entspricht es der Funktion mean
 wts = np.array([4,3,2,1]) 
 print('Wiederholte Aufruf der average() Funktion:', np.average(a, weights=wts))
 # Wenn der Parameter returned auf True gesetzt ist, wird die Summe der Gewichte zurückgegeben 
 print('Summe der Gewichte:', np.average([1,2,3, 4], weights = [4,3,2,1], returned = True))

输出结果为:

 Aufruf der Funktion average():2.5
 Wiederholte Aufruf der Funktion average():2.0}
 权重的和:(2.0, 10.0)

在多维数组中,可以指定用于计算的轴。

 import numpy as np 
 a = np.arange(6).reshape(3,2]) 
 wt = np.array([3,5]) 
 print ('修改后的数组:', np.average(a, axis = 1, weights = wt))
 print ('修改后的数组:', np.average(a, axis = 1, weights = wt, returned = True))

输出结果为:

 修改后的数组: [0.625 2.625 4.625])
 修改后的数组: (array([0.625, 2.625, 4.625]), array([8., 8., 8。))

标准差

标准差是一组数据平均值分散程度的一种度量。
标准差是方差的算术平方根。
标准差公式如下:

 std = sqrt(mean((x - x.mean())**2))

如果数组是 [1,2,3,4],则其平均值为 2.5。 因此,差的平方是 [2.25,0.25,0.25,2.25]),并且再求其平均值的平方根除以 4,即 sqrt(5/4) ,结果为 1.1180339887498949。

import numpy as np 
print (np.std([1,2,3,4))

输出结果为:

1.1180339887498949

方差

统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数,即 mean((x - x.mean())** 2)。
换句话说,标准差是方差的平方根。

import numpy as np 
print (np.var([1,2,3,4))
1.25