English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Ejemplo de operación de visualización de Pandas
Esta función en Series y DataFrame es solo un paquete simple del método plot() de la biblioteca matplotlib.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000', periods=10), columns=list('ABCD')) df.plot()
Los resultados de la ejecución son los siguientes:
Si el índice está compuesto por fechas, se llama a gct().autofmt_xdate() para formatear el eje x, como se muestra en la imagen superior.
Podemos usar las claves x e y para dibujar la relación entre una columna y otra.
Además del gráfico de línea predeterminado, los métodos de dibujo permiten usar varios estilos de dibujo. Estos métodos se pueden proporcionar como parámetros de clave kind en plot(). Estos incluyen:
Gráfico de barras Histograma Gráfico de caja Gráfico de área Gráfico de dispersión Gráfico de pizza
Vamos a ver cómo crear un gráfico de barras:
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.bar()
Los resultados de la ejecución son los siguientes:
Genera un gráfico de barras apiladas, se puede configurar stacked=True
import pandas as pd df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.bar(stacked=True)
Los resultados de la ejecución son los siguientes:
Para obtener un gráfico de barras horizontal, se puede usar el método barh:
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.barh(stacked=True)
Los resultados de la ejecución son los siguientes:
Se puede dibujar un histograma usando el método plot.hist(). Podemos especificar la cantidad.
import pandas as pd import numpy as np df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.plot.hist(bins=20)
Los resultados de la ejecución son los siguientes:
Se puede usar el siguiente código para dibujar histogramas diferentes para cada columna:
import pandas as pd import numpy as np df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.diff.hist(bins=20)
Los resultados de la ejecución son los siguientes:
Se puede dibujar un Boxplot llamando a Series.box.plot() y DataFrame.box.plot() o DataFrame.boxplot() para visualizar la distribución de valores en cada columna.
por ejemplo, este es un gráfico de caja, que representa el valor de una variable aleatoria en [01por ejemplo, este es un gráfico de caja, que representa el valor de una variable aleatoria en [010cinco pruebas sobre un valor aleatorio.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), columnas=['A', 'B', 'C', 'D', 'E']) df.plot.box()
Los resultados de la ejecución son los siguientes:
Se puede crear un gráfico de área utilizando el método Series.plot.area() o DataFrame.plot.area().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 4), columnas=['a', 'b', 'c', 'd']) df.plot.area()
Los resultados de la ejecución son los siguientes:
Se puede crear un gráfico de dispersión utilizando el método DataFrame.plot.scatter().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(50, 4), columnas=['a', 'b', 'c', 'd']) df.plot.scatter(x='a', y='b')
Los resultados de la ejecución son los siguientes:
Se puede crear un gráfico de pizza utilizando el método DataFrame.plot.pie().
import pandas as pd import numpy as np df = pd.DataFrame(3 * np.random.rand(4), índice=['a', 'b', 'c', 'd'], columnas=['x']) df.plot.pie(subplots=True)
Los resultados de la ejecución son los siguientes: