algoritmo a priori

El algoritmo Apriori es el primer algoritmo de minería de reglas de asociación y el algoritmo más clásico. Utiliza un método iterativo de búsqueda capa por capa para encontrar la relación entre conjuntos de elementos en la base de datos para formar reglas. El proceso consta de conexión (operaciones similares a matrices) y poda (eliminación de resultados intermedios innecesarios).

La idea básica de este algoritmo es: primero encontrar todos los conjuntos de frecuencias cuya frecuencia de aparición sea al menos tan alta como el soporte mínimo predefinido. Luego se generan reglas de asociación sólidas a partir del conjunto de frecuencias, y estas reglas deben satisfacer el apoyo mínimo y la credibilidad mínima.

Luego use el conjunto de frecuencias que se encuentra en el paso 1 para generar las reglas deseadas y genere todas las reglas que solo contengan los elementos del conjunto. Solo hay un elemento en el lado derecho de cada regla. de la regla se utiliza aquí. Una vez generadas estas reglas, solo se conservan aquellas reglas que sean mayores que el nivel mínimo de confianza dado por el usuario. Para generar todos los conjuntos de frecuencias, se utiliza un enfoque recursivo.

(1) L1 = find_frequent_1-itemset(D);

(2) para (k=2; Lk-1 ≠Φ; k) {

(3) Ck = apriori_gen(Lk-1, min_sup);

(4) para cada transacción t ∈?D?{//escanear D para recuentos

(5) Ct = subset(Ck, t); //obtiene los subconjuntos de t que son candidatos

(6) para cada candidato c ∈ Ct

(7) c.count;

(8)?}

(9) Lk ={c ∈ Ck|c.count≥min_sup}

(10)?}

(11) return L= ∪ k Lk;

La posibilidad de generar una gran cantidad de conjuntos de candidatos y la posibilidad de escanear repetidamente la base de datos son dos deficiencias importantes del algoritmo Apriori.