Khai phá dữ liệu trên hệ thông tin đa trị

Dựa trên ý tưởng thu nhỏ kích thước tập dữ liệu ban đầu, trong bài báo này tác giả đề xuất phương

pháp lựa chọn tập đối tượng đại diện, gọi tắt là mẫu đại diện, từ tập đối tượng ban đầu cho bài toán

tìm tập thuộc tính tối ưu của hệ thông tin đa trị. Tác giả chứng minh tập thuộc tính tối ưu trên tập

đối tượng ban đầu và tập thuộc tính tối ưu trên mẫu đại diện là tương đương, từ đó khẳng định tính

đúng đắn của phương pháp. Vì kích thước mẫu đại diện nhỏ hơn kích thước tập đối tượng ban đầu

nên thời gian thực hiện các thuật toán tìm tập thuộc tính tối ưu trên mẫu đại diện giảm thiểu đáng

kể. Kích thước mẫu đại diện được chọn lớn hay nhỏ phụ thuộc vào đặc thù mỗi hệ thông tin đa trị

trong thực tế. Đồng thời bài báo trình bày phương pháp khai phá luật xếp thứ tự bằng cách chuyển

đổi hệ thông tin đơn trị xếp thứ tự thành hệ thông tin đơn trị nhị phân và áp dụng các kỹ thuật sinh

luật trong lý thuyết tập thô trên hệ thông tin đơn trị nhị phân thu được.

Khai phá dữ liệu trên hệ thông tin đa trị trang 1

Khai phá dữ liệu trên hệ thông tin đa trị trang 1

Khai phá dữ liệu trên hệ thông tin đa trị trang 2

Khai phá dữ liệu trên hệ thông tin đa trị trang 2

Khai phá dữ liệu trên hệ thông tin đa trị trang 3

Khai phá dữ liệu trên hệ thông tin đa trị trang 3

Khai phá dữ liệu trên hệ thông tin đa trị trang 4

Khai phá dữ liệu trên hệ thông tin đa trị trang 4

Khai phá dữ liệu trên hệ thông tin đa trị trang 5

Khai phá dữ liệu trên hệ thông tin đa trị trang 5

Tải về để xem đầy đủ hơn

pdf8 trang | Chia sẻ: cucnt | Lượt xem: 312 | Lượt tải: 0download

File đính kèm:

  • pdfkhai_pha_du_lieu_tren_he_thong_tin_da_tri.pdf