English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Funciones estadísticas de NumPy

numpy.amin() y numpy.amax()

numpy.amin() se utiliza para calcular el valor mínimo de los elementos de un array a lo largo del eje especificado.
numpy.amax() se utiliza para calcular el valor máximo de los elementos de un array a lo largo del eje especificado.

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Nuestra matriz es:', a)
 print('Llame a la función amin():', np.amin(a,1))
 print('Llame nuevamente a la función amin():', np.amin(a, 0))
 print('Llame a la función amax():', np.amax(a))
 print('Llame nuevamente a la función amax():', np.amax(a, axis=0))

El resultado es:

 Nuestra matriz es: [[3 7 5])
  [8 4 3])
  [2 4 9]
 Llame a la función amin(): [3 3 2])
 Llame nuevamente a la función amin(): [2 4 3])
 Llame a la función amax(): 9
 Llamar nuevamente a la función amax(): [8 7 9])

numpy.ptp()

La función numpy.ptp() calcula la diferencia entre el valor máximo y el valor mínimo de los elementos del array (valor máximo - valor mínimo).

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Llamada a la función ptp():', np.ptp(a))
 print('A lo largo del eje 1 Llamada a la función ptp():', np.ptp(a, axis= 1))
 print('Llamada a la función ptp() a lo largo del eje 0:', np.ptp(a, axis=0))

El resultado es:

 Llamada a la función ptp(): 7
 A lo largo del eje 1 Llamada a la función ptp(): [4 5 7])
 Llamada a la función ptp() a lo largo del eje 0: [6 3 6])

numpy.percentile()

Los cuantiles son una medida utilizada en la estadística que representa el porcentaje de observaciones menores que este valor. La función numpy.percentile() acepta los siguientes parámetros.

numpy.percentile(a, q, axis)

Descripción de los parámetros:

a: array de entrada q: el cuantil a calcular, en 0 ~ 100 entre axis: lo largo del cual se calculan los cuantiles

Primero definamos los cuantiles:

El cuantil p es un valor que hace que al menos p% de los datos sean menores o iguales a él, y al menos (100-p)% de los datos son mayores o iguales a este valor.
Un ejemplo: Los resultados de los exámenes de admisión a la universidad a menudo se informan en forma de cuantiles. Por ejemplo, supongamos que un candidato obtuvo una puntuación original de 54 puntuación. Es difícil saber cómo se compara su rendimiento con otros estudiantes que participaron en el mismo examen. Pero si la puntuación original54puntuación exacta corresponde al70 cuantil, podemos saber aproximadamente70% de los estudiantes tienen una puntuación más baja que él, y aproximadamente30% de los estudiantes tienen una puntuación más alta que él.

Aquí p = 70.

 import numpy as np 
 a = np.array([[10, 7, 4], [3, 2, 1])
 # 50% de la cuantilidad, es decir, la mediana ordenada dentro de a
 print('Llamada a la función percentile():', np.percentile(a, 50)) 
 # axis es 0, en la columna vertical
 print(np.percentile(a, 50, axis=0)) 
 # axis es 1,en la fila horizontal
 print(np.percentile(a, 50, axis=1)) 
 # Mantener dimensiones invariables
 print(np.percentile(a, 50, axis=1, keepdims=True))

El resultado es:

 Llamada a la función percentile(): 3.5
 [6.5 4.5 2.5])
 [7. 2.]
 [[7.]
 [2.]]

numpy.median()

La función numpy.median() se utiliza para calcular la mediana (valor mediano) de los elementos del array a

 import numpy as np 
 a = np.array([[30,65,70],[80,95,10],[50,90,60]]) 
 print('Llamada a la función median():', np.median(a))
 print('Llame la función median() a lo largo del eje 0:', np.median(a, axis = 0))
 print('A lo largo del eje 1 Llame la función median():', np.median(a, axis = 1))

El resultado es:

 Llame la función median(): 65.0}
 Llame la función median() a lo largo del eje 0:[50. 90. 60.]
 A lo largo del eje 1 Llame la función median():[65. 80. 60.]

numpy.mean()

La función numpy.mean() devuelve el promedio aritmético de los elementos del array. Si se proporciona un eje, se calcula a lo largo de él.
El promedio aritmético es la suma de los elementos a lo largo del eje dividida por el número de elementos.

 import numpy as np 
 a = np.array([[1,2,3],[3,4,5],[4,5,6]) 
 print('Llame la función mean():', (np.mean(a)))
 print('Llame la función mean() a lo largo del eje 0:', np.mean(a, axis = 0))
 print('A lo largo del eje 1 Llame la función mean():', np.mean(a, axis = 1))

El resultado es:

 Llame la función mean():3.6666666666666665
 Llame la función mean() a lo largo del eje 0:[2.66666667 3.66666667 4.66666667])
 A lo largo del eje 1 Llame la función mean():[2. 4. 5.]

numpy.average()

La función numpy.average() calcula el promedio ponderado de los elementos del array basándose en los pesos proporcionados en otro array.
La función puede aceptar un parámetro de eje. Si no se especifica el eje, el array se expande.<
El promedio ponderado multiplica cada valor por su respectivo coeficiente, suma los valores obtenidos y divide la suma total por el número total de unidades.
Considere el array[1,2,3,4], y los pesos correspondientes [4,3,2,1], sumando los productos de los elementos correspondientes y dividiendo la suma por la suma de los pesos para calcular el promedio ponderado.

El promedio ponderado = (1*4+2*3+3*2+4*1])/(4+3+2+1])
 import numpy as np 
 a = np.array([1,2,3,4]) 
 print('Llame la función average():', np.average(a))
 # Si no se especifican pesos, es equivalente a la función mean
 wts = np.array([4,3,2,1]) 
 print('Llame nuevamente la función average():', np.average(a, weights = wts))
 # Si el parámetro returned se establece en True, devuelve la suma de los pesos 
 print('La suma de los pesos:', np.average([1,2,3, 4], weights = [4,3,2,1], returned = True))

El resultado es:

 Llame la función average():2.5
 Llame nuevamente la función average():2.0}
 La suma de los pesos: (2.0, 10.0)

En el array multidimensional, se puede especificar el eje utilizado para el cálculo.

 import numpy as np 
 a = np.arange(6).reshape(3,2]) 
 wt = np.array([3,5]) 
 print ('Array modificado:', np.average(a, axis = 1, weights = wt))
 print ('Array modificado:', np.average(a, axis = 1, weights = wt, returned = True))

El resultado es:

 Array modificado: [0.625 2.625 4.625])
 Array modificado: (array([0.625, 2.625, 4.625]), array([8. 8. 8.))

Desviación estándar

La desviación estándar es una medida de la dispersión del promedio de un conjunto de datos.
La desviación estándar es la raíz cuadrada aritmética de la varianza.
La fórmula de la desviación estándar es la siguiente:

 std = sqrt(mean((x - x.mean())**2))

Si el array es [1,2,3,4] y su media es 2.5。 Por lo tanto, el cuadrado de la diferencia es [2.25,0.25,0.25,2.25]) y luego la raíz cuadrada de la media de su valor medio dividida por 4,es decir, sqrt(5/4) ,el resultado es 1.1180339887498949。

import numpy as np 
print (np.std([1,2,3,4))

El resultado es:

1.1180339887498949

Varianza

La varianza en estadística (varianza de muestra) es la media de los cuadrados de la diferencia entre cada valor de muestra y el promedio de todos los valores de muestra, es decir, mean((x - x.mean())** 2)。
En otras palabras, la desviación estándar es la raíz cuadrada de la varianza.

import numpy as np 
print (np.var([1,2,3,4))
1.25