Học máy và Khai phá dữ liệu

 

1.     THÔNG TIN CHUNG

Tên học phần: Nhập môn học máy và khai phá dữ liệu (Introduction to Machine Learning and Data Mining)

Mã lớp kỳ 2023.2:

    + 147828 – IT3191E (xem trong thư mục riêng để có thêm tài liệu)

 

2.     MỤC TIÊU

Học máy (Machine Learning) đã và đang giúp con người tạo ra những sản phẩm vô cùng hữu ích, thay đổi cuộc sống của con người. Nó có thể giúp tạo ra những hệ thống máy móc mà có khả năng phán đoán (dự báo) một cách chính xác và khai phá tri thức mới từ một lượng dữ liệu lớn. Những hệ thống đó có khả năng tự học từ dữ liệu, mà ít cần hướng dẫn của con người.

Học phần này nhằm cung cấp cho sinh viên các kiến thức cơ bản về học máy và khai phá dữ liệu. Học phần bao gồm các khái niệm căn bản, các bài toán học cơ bản, quy trình xây dựng hệ thống dựa trên học máy và khai phá dữ liệu, các mô hình cơ bản (đôi khi chuyên sâu). Đó là những khối kiến thức cần thiết nhất khi người học muốn dùng Học máy (hay Khai phá dữ liệu) vào các ứng dụng trong thực tế. Học phần cũng giới thiệu vài ứng dụng điển hình của học máy trong thực tế, các công cụ hoặc thư viện hữu ích.

 

3.     NỘI DUNG

Bài

Nội dung

Slide
(English)

Code

Video
(Tiếng Việt)

Ghi chú

1

Giới thiệu chung

- Giới thiệu về Học máy và khai phá dữ liệu

- Học máy và các bài toán học

- Vài công cụ và thư viện hỗ trợ

PDF

 

https://youtu.be/jc1wo_8VA1w

 

 

+

Cơ sở toán học cho Học máy

PDF

 

 

Nhớ lại vài kiến thức cần thiết

2

Thu thập và tiền xử lý dữ liệu

PDF

Link

https://youtu.be/tVMyB7rIP-k

 

 

3

Hồi qui

- Giới thiệu bài toán hồi qui

- Mô hình tuyến tính

PDF

Link

https://youtu.be/3dC-_GAs2zI

Bao gồm Ridge và LASSO

4

Phân cụm

- Giới thiệu về phân cụm

- Tiêu chuẩn đánh giá chất lượng

- Phân cụm bằng K-means

PDF

 

https://youtu.be/vykd_CdGOPI

 

5

Phân cụm phân cấp

 

 

 

Chưa có

6

Học dựa trên láng giềng (KNN)

PDF

 

https://youtu.be/gHavNvEZyf4

 

7

Cây quyết định và rừng ngẫu nhiên

PDF

Link

Phần 1:

https://youtu.be/7P6yYhcSuPc

Phần 2:

https://youtu.be/BmoNAptI1nI

 

8

Máy vectơ hỗ trợ (SVM)

PDF

Link

Phần 1:

https://youtu.be/plSN3tCNllo

Phần 2:

https://youtu.be/e4Y7hTRHGHA

 

9

Đánh giá hiệu quả của mô hình

PDF

Link

Phần 1:

https://youtu.be/ujDDwR2GZZM

Phần 2:

https://youtu.be/tvt-2nOAYH4

 

10

Mạng nơron nhân tạo

PDF

 

Phần 1:

https://youtu.be/DjINWdgfZiE

Phần 2:

https://youtu.be/xI6qOuffvDk

Cơ bản

11

Mô hình xác suất

- Giới thiệu

- Học dựa trên MLE và MAP

- Phương pháp Naive Bayes

 

- Học bằng thuật toán EM

Phần 1:

PDF

 

 

 

Phần 2:

PDF

 

Phần 1:

https://youtu.be/qQHdOwRjHCE

https://youtu.be/t4y-oPXJ2yU

https://youtu.be/h60yXLPFBZE

https://youtu.be/siNwrMIrbec

 

Cơ bản

 

 

 

 

Khá chuyên sâu

+

Hiệu chỉnh (Regularization)

PDF

 

 

Bài giảng thêm, chuyên sâu

**

Một số bài giảng khác sẽ có trong thư mục của từng lớp (theo kỳ học)

 

 

 

 

Xem đầy đủ trên Youtube: https://www.youtube.com/watch?v=jc1wo_8VA1w&list=PLaKukjQCR56ZRh2cAkweftiZCF2sTg11_&index=1

 

n Tài liệu đọc: IT3190-Tai-lieu-doc.pdf

 

n Sách tham khảo

[1] Tom Mitchell. Machine Learning. McGraw-Hill, 1997.

[2] Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning. MIT press, 2016.

[3] Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: Concepts and Techniques (3rd Edition). Morgan Kaufmann, 2011.

[4] Trevor Hastie,‎ Robert Tibshirani,‎ Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction (12th Edition). Springer, 2017.