Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân

Nhiều thuật toán nhanh khai phá TMTX đã được đề xuất, nhưng cho đến nay thuật toán

Apriori do R. Agrawal và R. Srikant [2] đưa ra vẫn là thuật toán cơ bản nhất, có sức thuyết

phục và ảnh hưởng lớn đối với cộng đồng KPDL. Nhiều thuật toán sau này được xây dựng dựa

trên lược đồ của thuật toán Apriori và được gọi là các thuật toán kiểu Apriori (Apriori-like)

[3,5,9,10]. Sử dụng tính chất anti-monotone của TMTX, thuật toán kiểu Apriori thực hiện việc

phát hiện các TMTX theo từng bước. Tại mỗi bước phải thực hiện hai thủ tục: kết nối các tập

mục và tỉa các ứng viên. Hai thủ tục này đòi hỏi một khối lượng tính toán rất lớn và quá trình xử

lý các giao tác rất phức tạp. Do đó, khi CSDL có kích thước rất lớn, các thuật toán kiểu Apriori

thường không hiệu quả.

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 1

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 1

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 2

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 2

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 3

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 3

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 4

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 4

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 5

Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 5

Tải về để xem đầy đủ hơn

pdf7 trang | Chia sẻ: cucnt | Lượt xem: 504 | Lượt tải: 0download

File đính kèm:

  • pdfthuat_toan_khai_pha_tap_muc_thuong_xuyen_dua_tren_ma_tran_nh.pdf