Python es realmente muy simple. Capítulo 19 Serie Panda y DataFrames
Anaconda es una distribución de código abierto de Python, preinstalada con una gran cantidad de bibliotecas de terceros, principalmente para informática científica y análisis de datos. Su uso requiere más tiempo y ahorra trabajo que el Python original.
El sitio web oficial de descarga de Anaconda es: https://www.continuum.io/downloads. El método de descarga e instalación es muy sencillo. Si tienes alguna pregunta, puedes buscar contenido relevante en línea y aprender a resolverla.
Después de instalar Anaconda, encontrará que herramientas como Jupyter Notebook y Spyder están instaladas en el directorio de Anaconda. A continuación, usaremos principalmente Spyder para el desarrollo. Spyder es muy fácil de usar y también puedes buscar y aprender en línea.
Aunque Anaconda tiene muchos paquetes de software de uso común preinstalados, a veces necesitamos instalar algunos paquetes de software nosotros mismos. Puede instalarlo seleccionando el comando "Anaconda Anaconda Prompt" en el menú Inicio y escribiendo conda install (para el nombre del paquete) en la línea de comando, o pip install.
19.2 Paquete de análisis de datos Panda
Pandas es un paquete de análisis de datos para Python y el paquete Pandora se ha instalado junto con Anaconda.
Hay tres estructuras de datos de Pandas: Serie (matriz unidimensional), DataFrame (matriz bidimensional) y Panel (matriz tridimensional), de las cuales las dos primeras estructuras de datos son las más utilizadas. .
19.2.1 Serie
La serie se utiliza para almacenar una fila o columna de datos y la colección de índice asociada.
El formato de sintaxis es el siguiente:
Serie ()
Material impreso
Los resultados de salida son los siguientes:
1 pieza de tres
李思
3Wang Wu
Tipo de datos: objeto
El índice se especificó al crear la secuencia anterior. Si no se especifica, el valor del índice predeterminado comienza desde 0. Como se muestra a continuación:
s = serie (
Material impreso
Resultado de la ejecución:
0 piezas de tres
1 Lisi
2 Wang Wu
3 Sun Liu
Tipo de datos: objeto
⑷Eliminar elemento
de pandas importar serie
s = series(
③eliminar fila
df . drop(1, eje = 0) #eje = 0 significa eje de fila, También se puede omitir
④ Eliminar columna
df.drop('gender', axis = 1) #axis = 0 significa eje de columna
También. Utilice otro método:
del df【'gender'】
⑤Agregar columna
df【'phone'】=【'1111111',' 222222'. , '333333'】
Imprimir (df)
Resultados de la ejecución:
Nombre, sexo, edad, número de teléfono
0tres hombres18 1111111.
1 Li Sinu 19 2222222
2 Wang Wunan 17 3333333
⑹Agregar líneas
df loc【len(df) ]=. ['Sun Liu', 'Male', '20']
⑺Agregar
Desde Panda Import Series
Desde Panda Import Data Frame p>
nombre = Serie (['Zhang San'' Li Si'' Wang Wu'])
Sexo = Serie (['Hombre', 'Mujer', 'Hombre'])
edad = Serie ([18, 19, 17])
Df = DataFrame ({'nombre': nombre, género: género, 'edad': edad}) #Usar nombre Crear un dato marco para las variables de DF.
nombre 1 = Serie (['Sun Liu', 'Hou Qi'])
sexo 1 = Serie (['Masculino', 'Mujer'])
edad 1 = serie ([19, 17])
df 1 = marco de datos ({'nombre': nombre 1, 'género': género 1, 'edad': edad 1})
#Crea un DataFrame usando una variable llamada df1.
df = df . append (df 1, ignore_index=True)
#Append df1 a df, el parámetro ignore_index=True significa volver a indexar.
Imprimir (df)
Resultados de la ejecución:
Nombre, sexo y edad
0 Zhang Sannan 18
1 Li Sinu 19
2 Wang Wunan 17
3 Sun Liunan 19
4 Esperando a siete chicas 17