Eliminación de duplicados del diccionario de Excel
Recordatorio: ¡este debería ser el más completo que puedas ver hasta ahora! ¡Recoge primero!
Requisito: ¿Contar el número de personal no duplicado en el área correspondiente?
Método 1: Columna auxiliar + función
¡Este método se recomienda para principiantes para ayudarlos a resolver problemas!
= SUMPRODUCT($B$2:$B$15=$E2)/COUNTIFS($A$2:$A$15,$A$2:$A$15)
Estadísticas simples sin Contenido duplicado sin condiciones. ¡Básicamente todo el mundo conoce la rutina SUMA (1/CONTAR.)! Si hay condiciones, podemos combinar varias condiciones y convertirlas en una columna, luego usar estadísticas no repetidas de una sola columna y finalmente filtrar según el área igual a la demanda.
Si eres un maestro de funciones, ¡no necesitas la columna auxiliar!
Método 2: Método de función (sin columna auxiliar)
= SUMPRODUCT (($A$2:$A$15 = $D2)/COUNTIFS($A$2:$A$ 15 . $ A $ 2: $ A $ 15. $ B $ 2: $ B $ 15))
No necesito explicar mucho esto. ¡Simplemente puse la columna auxiliar en la fórmula y la condición única se convirtió en condiciones múltiples!
¡Está bien! Dijiste que el método funcional es demasiado difícil. ¿Hay algo que Xiaobai pueda lograr? ¡Probar!
Método tres: método de tabla dinámica (novato)
Nota importante: se debe seleccionar "Agregar al modelo de datos" al crear una tabla dinámica para usar estadísticas no repetidas.
¡La esencia es la función estadística no repetitiva de Power Pivot!
Si cree que el método anterior es demasiado blanco, podemos probar Power Query.
Método 4: Power Query
Haga clic en [Convertir]-[Agrupación de datos]-[Confirmar sin recuento duplicado].
¡Usar la función de agrupación incorporada en PQ también puede resolver fácilmente esta necesidad! ¡Aún no podría ser más sencillo!
Si quieres ser genial, ¿qué tal si usas VBA?
Método 5: VBA
Las estadísticas de duplicación son el punto fuerte del diccionario, pero las condiciones para la deduplicación son un poco problemáticas, pero se puede lograr fácilmente usando un diccionario de dos capas. ! Amantes de VBA, ¡pueden consultar este artículo!
Método 6: Medida PowerPivot-DAX
Utilizando la función DAX DISTINCTCOUNT en PP se puede calcular el número de elementos distintos de forma muy sencilla.
¡Escribe una medida y tírala al campo de valor de la tabla dinámica!
De hecho, aquí, eso es casi suficiente. ¡No digas siempre que no lo harás y nunca lo olvides!
De repente se me ocurrió que hacía mucho que no escribía SQL y ¡parece que sé un poco al respecto! ¿Por qué no escribes SQL y lo practicas de paso?
Método 7: método SQL
Seleccione la región, cuente (*) como fuente de personas no duplicadas (seleccione un * distinto de [datos $] donde la región ""; Nulo) agrupar por región
Primero utilice una subconsulta para eliminar duplicados y luego realice un recuento de agregación agrupada. ¡Bienvenidos todos los maestros de SQL para brindar buenas ideas!
¡Está bien! Finalmente, escribiré otro artículo sobre Python, ¡eso es todo!
Método 8: Fanwai -Python
Df.drop_duplicates(). grupopor("área"). Count()
Panda una vez más actualizó mi comprensión de las estadísticas de datos, ¡y lo hizo en una sola oración! No defienda Python
Pero pandas es de hecho una biblioteca de análisis de datos muy útil, ¡quién sabe quién la usa!