Colección de citas famosas - Slogan de motivación - 4. Mal procesamiento de datos (descarte y llenado)

4. Mal procesamiento de datos (descarte y llenado)

Descartar datos significa descartar algunos datos inútiles según las condiciones del filtro.

Por defecto, Eje=0 (para operaciones de fila).

Tres métodos:

Drop(): elimina varias filas o columnas de datos según las etiquetas.

El método duplicado() devuelve una secuencia booleana que indica si cada fila está duplicada y solo la última fila duplicada se marca como Verdadera.

I. Devuelve una secuencia booleana:

Dos. Descartar datos mediante filtrado booleano:

Tres. El método drop_duplicates() simplifica la deduplicación (en este caso, solo queremos juzgar los duplicados en función de "una" columna):

El método dropna() puede descartar datos relacionados con valores faltantes.

Descarte las filas con valores faltantes en todas las columnas y reemplace el objeto original:

Isnull(): juzgue todos los valores en el objeto panda uno por uno y devuelva un objeto del mismo tamaño. Si es NaN, devuelve Verdadero.

Verdadero y Falso se pueden considerar como 1 y 0 respectivamente al realizar operaciones aritméticas. Por lo tanto, para contar el número de valores faltantes en cada fila o columna, podemos sumar directamente a lo largo o largo de la columna:

Cuatro métodos de llenado usando el método fillna():

Ejemplo: Rellenar con 0

Configurando parámetros del método:

Ejemplo:

Se logra pasando un diccionario.

Ejemplo: Complete “0” en la columna “uno” y “1” en la columna “tres”.

Usando la función de alineación automática de Pandas, podemos pasar directamente el objeto Pandas a fillna().