Colección de citas famosas - Colección de consignas - Algoritmo a priori para reglas de asociación

Algoritmo a priori para reglas de asociación

La idea principal del algoritmo Apriori es encontrar el conjunto de elementos frecuentes máximo que existe en el conjunto de datos de la cosa y luego utilizar el conjunto de elementos frecuentes máximo obtenido y el umbral de confianza mínimo preestablecido para generar una fuerte reglas de asociación.

Un conjunto de elementos es una colección de elementos. Un conjunto de elementos que contiene k elementos se denomina conjunto de k elementos. La frecuencia de aparición de un conjunto de elementos es el recuento de todas las transacciones que contienen el conjunto de elementos, también conocido como soporte absoluto o recuento de soporte. Si el soporte relativo de un conjunto de elementos I satisface un umbral mínimo de soporte predefinido, entonces I es un conjunto de elementos frecuentes. Los conjuntos de elementos k frecuentes generalmente se indican como k.

La probabilidad de que los conjuntos de elementos A y B ocurran simultáneamente se llama soporte de la regla de asociación (también llamado soporte relativo).

Si ocurre el conjunto de elementos A, la probabilidad de que ocurra el conjunto de elementos B es la confianza de la regla de asociación.

El soporte mínimo es un umbral definido por los usuarios o expertos para medir el soporte, que indica la importancia estadística más baja de un conjunto de elementos. La confianza mínima es un umbral definido por los usuarios o expertos para medir la confianza, que indica la confiabilidad mínima. de las reglas de asociación. Las reglas que satisfacen tanto el umbral mínimo de soporte como el umbral mínimo de confianza se denominan reglas estrictas.

El recuento de soporte del conjunto de elementos A es el número de transacciones en el conjunto de datos de transacciones que contiene el conjunto de elementos A, lo que se conoce como frecuencia o recuento del conjunto de elementos.

Todos los elementos no vacíos de un conjunto de elementos frecuentes también deben ser conjuntos de elementos frecuentes. De acuerdo con esta propiedad, se puede concluir que si la transacción A se agrega a un conjunto de elementos que no es un conjunto de elementos frecuentes I, el nuevo conjunto de elementos I U A tampoco debe ser un conjunto de elementos frecuentes.

1) Encuentre todos los conjuntos de elementos frecuentes (el soporte debe ser mayor o igual que el umbral de soporte mínimo dado a D. En este proceso, el paso de conexión y el paso de poda se fusionan y finalmente). Se obtiene el conjunto de elementos máximo frecuente.

El propósito del paso de conexión es encontrar K conjuntos de elementos. Para un umbral mínimo de soporte dado, para el conjunto candidato de 1 elemento C1, elimine los conjuntos de elementos más pequeños que el umbral para obtener un conjunto de elementos frecuentes de 1 elemento. L1; siguiente En un paso, el propio L1 se conecta para generar un conjunto candidato de 2 elementos C2, y los conjuntos de elementos en C2 que satisfacen las restricciones se retienen para obtener un conjunto frecuente de 2 elementos, registrado como L2; En el siguiente paso, L2 y L3 se conectan para generar un conjunto candidato de 3 elementos C3, y los conjuntos de elementos en C2 que satisfacen las restricciones se retienen. El conjunto de elementos de las condiciones de restricción obtiene 3 conjuntos de elementos frecuentes, que se registran como L3. Este ciclo continúa hasta que se obtiene el máximo número de elementos frecuentes Lk.

El paso de poda sigue al paso de conexión y sirve para reducir el espacio de búsqueda en el proceso de generación de elementos candidatos Ck. Dado que Ck se genera conectando Lk-1 y L1, todos los subconjuntos no vacíos de conjuntos de elementos frecuentes también deben ser conjuntos de elementos frecuentes de acuerdo con las propiedades de Apriori, por lo que los conjuntos de elementos que no cumplan esta propiedad no existirán en Ck. Este proceso es poda. . rama.

2) Genere reglas de asociación sólidas a partir de conjuntos de elementos frecuentes: a partir del proceso 1), se puede saber que se han propuesto conjuntos de elementos que no exceden el umbral mínimo de soporte predeterminado si las reglas restantes satisfacen el predeterminado. umbral mínimo de grado de confianza, entonces se extraen reglas de asociación sólidas.