Home

Danh sách đề tài:

0- Đề tài do sinh viên đề xuất: Ngoài các tiêu chí cơ bản, cần phải đáp ứng các tiêu chí như phù hợp với thời gian của một đồ án; củng cố và nâng cao các môn học; làm việc nhóm.

1- Biểu diễn đồ họa mạng Wikipedia: Xây dựng một công cụ cho phép biểu diễn đồ họa các mối quan hệ giữa các khái niệm trên mạng bách khoa tri thức Wikipedia.

2- Xây dựng một bộ máy tìm kiếm tiếng Việt trên nền web: Xây dựng một bộ máy tìm kiếm cho tiếng Việt với chức năng cơ bản là tìm kiếm theo câu truy vấn. Yêu cầu CSDL của bộ máy tìm kiếm phải đủ lớn, đa linh vực hoặc tập trung vào một lĩnh vực cụ thể.

3- Phân tích phản hồi của người đọc trên các trang báo: Thu thập phản hồi của người đọc trên các trang báo tin tức và phân tích nội dung các phản hồi đó (dựa trên kĩ thuật phân cụm hoặc xếp hạng...).

4- Gán nhãn các địa điểm du lịch trên văn bản: Tìm và gán nhãn các địa điểm du lịch xuất hiện trong văn bản. Tập trung vào mục Du lịch của các báo tin tức hay các diễn đàn du lich (phuot.vn).

5- Mô phỏng hoạt động của mạng xã hội Twitter: Xây dựng một mạng xã hội có các chức năng cơ bản như Twitter.

6- Tính toán độ tương đồng ngữ nghĩa của từ dựa trên tập văn bản: Tính toán độ tương đồng ngữ nghĩa giữa hai từ (ví dụ 'cát' và 'bãi biển') dựa trên kĩ thuật thống kê một số lượng lớn văn bản.

7- Gán nhãn các cụm từ chỉ thời gian trong văn bản: Tìm và gán nhãn các cụm từ chỉ thời gian xuất hiện trong văn bản.

Chú ý:

- Các hệ thống đều phải được xây dựng để làm việc với tiếng Việt (cũng khuyến khích sinh viên mở rộng ra các ngôn ngữ khác như tiếng Anh).

- Kĩ năng thu thập văn bản từ Internet và các thao tác cơ bản về xử lý văn bản là cần thiết.

- Khuyến khích tìm hiểu về các xu hướng xã hội trên mạng Internet và tìm hiểu về các công cụ học máy cơ bản để phân cụm, gán nhãn.

Home