Marco de datos

DataFrame es una estructura de datos tabular que contiene un conjunto ordenado de columnas, cada columna puede tener valores diferentes. Un DataFrame tiene índices de filas y columnas y puede considerarse como un diccionario compuesto de series, pero las series comparten un índice común.

Valor, columna, índice, forma

Si el índice son caracteres chinos, a veces no se pueden recuperar los resultados.

Hay dos formas de acceder a las columnas del dataframe y devolver la serie.

Accede a la fila especificada y devuelve la serie.

Obtener un valor o modificar un valor

Parámetro:

es nulo(). any(): verdadero si los datos de la fila/columna están vacíos, falso si todos los datos de la fila/columna están presentes.

No nulo(). all(): verdadero si todos los datos de esa fila/columna existen; falso en caso contrario.

Eliminar cuando haya datos vacíos en la fila/columna.

Eliminar cuando la fila/columna contenga todos los datos vacíos.

Parámetros internos de la función:

El índice multinivel de columna es similar al índice multinivel de fila.

La diferencia entre fusionar y concat es que la fusión debe fusionarse en función de la misma fila o columna.

Al fusionar usando pd.merge(), las columnas con el mismo nombre de columna se usarán automáticamente como clave a fusionar.

Si los datos de las columnas con el mismo nombre de columna son diferentes, tome la parte común:

Si hay datos de uno a muchos en la columna con el mismo nombre de columna , se mostrarán varios datos;

p>

En una combinación de muchos a muchos, no se ahorra ningún dato.

Cuando hay varias columnas idénticas, especifique cuál es la clave de columna.

Conserve solo dos claves (modo predeterminado)

Rellene NaN en los espacios.