English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Visualización de Pandas

    Ejemplo de operación de visualización de Pandas

Dibujo básico: Dibujo

Esta función en Series y DataFrame es solo un paquete simple del método plot() de la biblioteca matplotlib.

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
    periods=10), columns=list('ABCD'))
 df.plot()

Los resultados de la ejecución son los siguientes:

Si el índice está compuesto por fechas, se llama a gct().autofmt_xdate() para formatear el eje x, como se muestra en la imagen superior.
Podemos usar las claves x e y para dibujar la relación entre una columna y otra.

Además del gráfico de línea predeterminado, los métodos de dibujo permiten usar varios estilos de dibujo. Estos métodos se pueden proporcionar como parámetros de clave kind en plot(). Estos incluyen:

Gráfico de barras Histograma Gráfico de caja Gráfico de área Gráfico de dispersión Gráfico de pizza

Gráfico de barras

Vamos a ver cómo crear un gráfico de barras:

 import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
 df.plot.bar()

Los resultados de la ejecución son los siguientes:

Genera un gráfico de barras apiladas, se puede configurar stacked=True

import pandas as pd
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
 df.plot.bar(stacked=True)

Los resultados de la ejecución son los siguientes:

Para obtener un gráfico de barras horizontal, se puede usar el método barh:

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
 df.plot.barh(stacked=True)

Los resultados de la ejecución son los siguientes:

Histograma

Se puede dibujar un histograma usando el método plot.hist(). Podemos especificar la cantidad.

import pandas as pd
 import numpy as np
 df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.plot.hist(bins=20)

Los resultados de la ejecución son los siguientes:

Se puede usar el siguiente código para dibujar histogramas diferentes para cada columna:

import pandas as pd
 import numpy as np
 df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
 np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 df.diff.hist(bins=20)

Los resultados de la ejecución son los siguientes:

Gráfico de caja

Se puede dibujar un Boxplot llamando a Series.box.plot() y DataFrame.box.plot() o DataFrame.boxplot() para visualizar la distribución de valores en cada columna.
por ejemplo, este es un gráfico de caja, que representa el valor de una variable aleatoria en [01por ejemplo, este es un gráfico de caja, que representa el valor de una variable aleatoria en [010cinco pruebas sobre un valor aleatorio.

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 5), columnas=['A', 'B', 'C', 'D', 'E'])
 df.plot.box()

Los resultados de la ejecución son los siguientes:

Gráfico de área

Se puede crear un gráfico de área utilizando el método Series.plot.area() o DataFrame.plot.area().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(10, 4), columnas=['a', 'b', 'c', 'd'])
 df.plot.area()

Los resultados de la ejecución son los siguientes:

Gráfico de dispersión

Se puede crear un gráfico de dispersión utilizando el método DataFrame.plot.scatter().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(np.random.rand(50, 4), columnas=['a', 'b', 'c', 'd'])
 df.plot.scatter(x='a', y='b')

Los resultados de la ejecución son los siguientes:

Gráfico de pizza

Se puede crear un gráfico de pizza utilizando el método DataFrame.plot.pie().

import pandas as pd
 import numpy as np
 df = pd.DataFrame(3 * np.random.rand(4), índice=['a', 'b', 'c', 'd'], columnas=['x'])
 df.plot.pie(subplots=True)

Los resultados de la ejecución son los siguientes: