Khai phá dữ liệu trên hệ thông tin đa trị
Dựa trên ý tưởng thu nhỏ kích thước tập dữ liệu ban đầu, trong bài báo này tác giả đề xuất phương
pháp lựa chọn tập đối tượng đại diện, gọi tắt là mẫu đại diện, từ tập đối tượng ban đầu cho bài toán
tìm tập thuộc tính tối ưu của hệ thông tin đa trị. Tác giả chứng minh tập thuộc tính tối ưu trên tập
đối tượng ban đầu và tập thuộc tính tối ưu trên mẫu đại diện là tương đương, từ đó khẳng định tính
đúng đắn của phương pháp. Vì kích thước mẫu đại diện nhỏ hơn kích thước tập đối tượng ban đầu
nên thời gian thực hiện các thuật toán tìm tập thuộc tính tối ưu trên mẫu đại diện giảm thiểu đáng
kể. Kích thước mẫu đại diện được chọn lớn hay nhỏ phụ thuộc vào đặc thù mỗi hệ thông tin đa trị
trong thực tế. Đồng thời bài báo trình bày phương pháp khai phá luật xếp thứ tự bằng cách chuyển
đổi hệ thông tin đơn trị xếp thứ tự thành hệ thông tin đơn trị nhị phân và áp dụng các kỹ thuật sinh
luật trong lý thuyết tập thô trên hệ thông tin đơn trị nhị phân thu được.
Khai phá dữ liệu trên hệ thông tin đa trị trang 1
Khai phá dữ liệu trên hệ thông tin đa trị trang 2
Khai phá dữ liệu trên hệ thông tin đa trị trang 3
Khai phá dữ liệu trên hệ thông tin đa trị trang 4
Khai phá dữ liệu trên hệ thông tin đa trị trang 5
Tải về để xem đầy đủ hơn
File đính kèm:
- khai_pha_du_lieu_tren_he_thong_tin_da_tri.pdf