Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang
Phân cụm dựa trên tích tụ phân cấp (Hierarchical
Agglomerative Clustering – HAC) sẽ xây dựng dendrogram
từ mức đáy (cuối) dần lên (bottom-up)
Giải thuật HAC
• Bắt đầu, mỗi ví dụ chính là một cụm (là một nút trong dendrogram)
• Hợp nhất 2 cụm có mức độ tương tự (gần) nhau nhất
Cặp gồm 2 cụm có khoảng cách nhỏ nhất trong số các cặp cụm
• Tiếp tục quá trình hợp nhất
• Giải thuật kết thúc khi tất cả các ví dụ được hợp nhất thành một
cụm duy nhất (là nút gốc trong dendrogram
Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang trang 1
Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang trang 2
Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang trang 3
Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang trang 4
Bài giảng Học máy - Bài 12: Phân cụm dựa trên tích tụ phân cấp - Nguyễn Nhật Quang trang 5
Tải về để xem đầy đủ hơn
File đính kèm:
- bai_giang_hoc_may_bai_12_phan_cum_dua_tren_tich_tu_phan_cap.pdf