Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản
tf(w,d): số lần xuất hiện của từ w trong văn bản ơ
• Số lần xuất hiện càng cao thì từ càng có vai trò quan trọng trong văn bản
• Từ dừng có tần xuất xuất hiện cao trong hầu hết văn bản nhưng đã bị loại bỏ trong bước tiền xử lý
• Chưa thể hiện vai trò của từ trong cả tập văn bản
Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản trang 1
Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản trang 2
Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản trang 3
Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản trang 4
Bài giảng Xử lý ngôn ngữ tự nhiên - Chương 4: Phân lớp văn bản trang 5
Tải về để xem đầy đủ hơn
File đính kèm:
- bai_giang_xu_ly_ngon_ngu_tu_nhien_chuong_4_phan_lop_van_ban.pdf