Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân
Nhiều thuật toán nhanh khai phá TMTX đã được đề xuất, nhưng cho đến nay thuật toán
Apriori do R. Agrawal và R. Srikant [2] đưa ra vẫn là thuật toán cơ bản nhất, có sức thuyết
phục và ảnh hưởng lớn đối với cộng đồng KPDL. Nhiều thuật toán sau này được xây dựng dựa
trên lược đồ của thuật toán Apriori và được gọi là các thuật toán kiểu Apriori (Apriori-like)
[3,5,9,10]. Sử dụng tính chất anti-monotone của TMTX, thuật toán kiểu Apriori thực hiện việc
phát hiện các TMTX theo từng bước. Tại mỗi bước phải thực hiện hai thủ tục: kết nối các tập
mục và tỉa các ứng viên. Hai thủ tục này đòi hỏi một khối lượng tính toán rất lớn và quá trình xử
lý các giao tác rất phức tạp. Do đó, khi CSDL có kích thước rất lớn, các thuật toán kiểu Apriori
thường không hiệu quả.
Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 1
Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 2
Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 3
Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 4
Thuật toán khai phá tập mục thường xuyên dựa trên ma trận nhị phân trang 5
Tải về để xem đầy đủ hơn
File đính kèm:
- thuat_toan_khai_pha_tap_muc_thuong_xuyen_dua_tren_ma_tran_nh.pdf