4. Mal procesamiento de datos (descarte y llenado)
Por defecto, Eje=0 (para operaciones de fila).
Tres métodos:
Drop(): elimina varias filas o columnas de datos según las etiquetas.
El método duplicado() devuelve una secuencia booleana que indica si cada fila está duplicada y solo la última fila duplicada se marca como Verdadera.
I. Devuelve una secuencia booleana:
Dos. Descartar datos mediante filtrado booleano:
Tres. El método drop_duplicates() simplifica la deduplicación (en este caso, solo queremos juzgar los duplicados en función de "una" columna):
El método dropna() puede descartar datos relacionados con valores faltantes.
Descarte las filas con valores faltantes en todas las columnas y reemplace el objeto original:
Isnull(): juzgue todos los valores en el objeto panda uno por uno y devuelva un objeto del mismo tamaño. Si es NaN, devuelve Verdadero.
Verdadero y Falso se pueden considerar como 1 y 0 respectivamente al realizar operaciones aritméticas. Por lo tanto, para contar el número de valores faltantes en cada fila o columna, podemos sumar directamente a lo largo o largo de la columna:
Cuatro métodos de llenado usando el método fillna():
Ejemplo: Rellenar con 0
Configurando parámetros del método:
Ejemplo:
Se logra pasando un diccionario.
Ejemplo: Complete “0” en la columna “uno” y “1” en la columna “tres”.
Usando la función de alineación automática de Pandas, podemos pasar directamente el objeto Pandas a fillna().