Colección de citas famosas - Diccionario de frases chinas - Python es realmente muy simple. Capítulo 19 Serie Panda y DataFrames

Python es realmente muy simple. Capítulo 19 Serie Panda y DataFrames

Instalar Anaconda

Anaconda es una distribución de código abierto de Python, preinstalada con una gran cantidad de bibliotecas de terceros, principalmente para informática científica y análisis de datos. Su uso requiere más tiempo y ahorra trabajo que el Python original.

El sitio web oficial de descarga de Anaconda es: https://www.continuum.io/downloads. El método de descarga e instalación es muy sencillo. Si tienes alguna pregunta, puedes buscar contenido relevante en línea y aprender a resolverla.

Después de instalar Anaconda, encontrará que herramientas como Jupyter Notebook y Spyder están instaladas en el directorio de Anaconda. A continuación, usaremos principalmente Spyder para el desarrollo. Spyder es muy fácil de usar y también puedes buscar y aprender en línea.

Aunque Anaconda tiene muchos paquetes de software de uso común preinstalados, a veces necesitamos instalar algunos paquetes de software nosotros mismos. Puede instalarlo seleccionando el comando "Anaconda Anaconda Prompt" en el menú Inicio y escribiendo conda install (para el nombre del paquete) en la línea de comando, o pip install.

19.2 Paquete de análisis de datos Panda

Pandas es un paquete de análisis de datos para Python y el paquete Pandora se ha instalado junto con Anaconda.

Hay tres estructuras de datos de Pandas: Serie (matriz unidimensional), DataFrame (matriz bidimensional) y Panel (matriz tridimensional), de las cuales las dos primeras estructuras de datos son las más utilizadas. .

19.2.1 Serie

La serie se utiliza para almacenar una fila o columna de datos y la colección de índice asociada.

El formato de sintaxis es el siguiente:

Serie ()

Material impreso

Los resultados de salida son los siguientes:

1 pieza de tres

李思

3Wang Wu

Tipo de datos: objeto

El índice se especificó al crear la secuencia anterior. Si no se especifica, el valor del índice predeterminado comienza desde 0. Como se muestra a continuación:

s = serie (

Material impreso

Resultado de la ejecución:

0 piezas de tres

1 Lisi

2 Wang Wu

3 Sun Liu

Tipo de datos: objeto

⑷Eliminar elemento

de pandas importar serie

s = series(

③eliminar fila

df . drop(1, eje = 0) #eje = 0 significa eje de fila, También se puede omitir

④ Eliminar columna

df.drop('gender', axis = 1) #axis = 0 significa eje de columna

También. Utilice otro método:

del df【'gender'】

⑤Agregar columna

df【'phone'】=【'1111111',' 222222'. , '333333'】

Imprimir (df)

Resultados de la ejecución:

Nombre, sexo, edad, número de teléfono

0tres hombres18 1111111.

1 Li Sinu 19 2222222

2 Wang Wunan 17 3333333

⑹Agregar líneas

df loc【len(df) ]=. ['Sun Liu', 'Male', '20']

⑺Agregar

Desde Panda Import Series

Desde Panda Import Data Frame

nombre = Serie (['Zhang San'' Li Si'' Wang Wu'])

Sexo = Serie (['Hombre', 'Mujer', 'Hombre'])

edad = Serie ([18, 19, 17])

Df = DataFrame ({'nombre': nombre, género: género, 'edad': edad}) #Usar nombre Crear un dato marco para las variables de DF.

nombre 1 = Serie (['Sun Liu', 'Hou Qi'])

sexo 1 = Serie (['Masculino', 'Mujer'])

edad 1 = serie ([19, 17])

df 1 = marco de datos ({'nombre': nombre 1, 'género': género 1, 'edad': edad 1})

#Crea un DataFrame usando una variable llamada df1.

df = df . append (df 1, ignore_index=True)

#Append df1 a df, el parámetro ignore_index=True significa volver a indexar.

Imprimir (df)

Resultados de la ejecución:

Nombre, sexo y edad

0 Zhang Sannan 18

1 Li Sinu 19

2 Wang Wunan 17

3 Sun Liunan 19

4 Esperando a siete chicas 17