Trong buổi học số 9 của học phần Khai thác dữ liệu, chúng ta sẽ cùng tìm hiểu một chủ đề quan trọng trong học máy không giám sát, đó là phân cụm dữ liệu (Clustering) và thuật toán nổi bật nhất: K-means. Mở đầu bài giảng, giảng viên sẽ giúp người học hiểu được phân cụm là gì, nó thuộc mô hình học máy nào, và tại sao nó lại đóng vai trò quan trọng trong việc rút trích thông tin có ý nghĩa từ tập dữ liệu chưa gán nhãn. Tiếp theo, bài giảng đi vào phần lý thuyết cốt lõi của thuật toán K-means: cách chọn số cụm, cách khởi tạo tâm cụm, tính khoảng cách và cập nhật cụm qua từng vòng lặp cho đến khi hội tụ.
Bên cạnh lý thuyết, video cũng cung cấp các ví dụ minh họa cụ thể, sử dụng tập dữ liệu số nguyên đơn giản gồm 10 phần tử để sinh viên dễ hình dung quá trình gom cụm và cách tâm cụm di chuyển sau mỗi vòng lặp. Người học cũng sẽ được giới thiệu độ đo khoảng cách thường dùng như khoảng cách Euclid – những yếu tố quan trọng ảnh hưởng trực tiếp đến kết quả phân cụm.
Поделиться в:
Доступные форматы для скачивания:
Скачать видео mp4
Информация по загрузке:
Скачать аудио mp3
Похожие видео
array(20) {
["FIVYppiQkMs"]=>
object(stdClass)#5509 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "FIVYppiQkMs"
["related_video_title"]=>
string(116) "Bài giảng Khai thác dữ liệu – Buổi 10: Các chỉ số đánh giá, Thuật toán K-Medoid, AGNES, DIANA"
["posted_time"]=>
string(27) "6 месяцев назад"
["channelName"]=>
NULL
}
["PLf5IPckgFwFXx4iupnopVRPflUGquequj"]=>
object(stdClass)#5531 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(34) "PLf5IPckgFwFXx4iupnopVRPflUGquequj"
["related_video_title"]=>
string(43) "Khai thác dữ liệu (Course 2025 - HUIT)"
["posted_time"]=>
string(0) ""
["channelName"]=>
NULL
}
["PLu-LVHS6JzYjoUuPAwcE9sff2NMrEH6KD"]=>
object(stdClass)#5510 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(34) "PLu-LVHS6JzYjoUuPAwcE9sff2NMrEH6KD"
["related_video_title"]=>
string(26) "Machine Learning Cơ Bản"
["posted_time"]=>
string(0) ""
["channelName"]=>
NULL
}
["VqZLrMkKUfs"]=>
object(stdClass)#5525 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "VqZLrMkKUfs"
["related_video_title"]=>
string(81) "Bài giảng Khai thác dữ liệu – Buổi 11: Phân tích phương sai ANOVA"
["posted_time"]=>
string(27) "6 месяцев назад"
["channelName"]=>
NULL
}
["5vDGsDd0_K8"]=>
object(stdClass)#5511 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "5vDGsDd0_K8"
["related_video_title"]=>
string(60) "Bài giảng Khai thác dữ liệu (Data Mining) - Buổi 1"
["posted_time"]=>
string(28) "10 месяцев назад"
["channelName"]=>
NULL
}
["EdSYsC6sSNA"]=>
object(stdClass)#5527 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "EdSYsC6sSNA"
["related_video_title"]=>
string(159) "⚡️ Рекордная атака Путина по Киеву || Срочный вылет Зеленского || Удар по Новороссийску"
["posted_time"]=>
string(21) "3 часа назад"
["channelName"]=>
NULL
}
["qwosU7e9mqc"]=>
object(stdClass)#5517 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "qwosU7e9mqc"
["related_video_title"]=>
string(154) "Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности"
["posted_time"]=>
string(25) "2 месяца назад"
["channelName"]=>
NULL
}
["ml2TMVOGP9M"]=>
object(stdClass)#5519 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "ml2TMVOGP9M"
["related_video_title"]=>
string(157) "Россию ждет судьба СССР. Рост цен больше сдерживать не будут. Беседа с Игорем Липсицем"
["posted_time"]=>
string(24) "13 часов назад"
["channelName"]=>
NULL
}
["GIQ1m2yXNI4"]=>
object(stdClass)#5514 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "GIQ1m2yXNI4"
["related_video_title"]=>
string(143) "Как Зеленский попал в крупнейший коррупционный скандал своего президентства?"
["posted_time"]=>
string(24) "12 часов назад"
["channelName"]=>
NULL
}
["ZJHUvUW9JAU"]=>
object(stdClass)#5535 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "ZJHUvUW9JAU"
["related_video_title"]=>
string(130) "Кремль говорит о завершении войны / Эти слова Лаврова вырезали из эфира"
["posted_time"]=>
string(21) "3 часа назад"
["channelName"]=>
NULL
}
["QmbkG_wDQag"]=>
object(stdClass)#5516 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "QmbkG_wDQag"
["related_video_title"]=>
string(86) "ИТОГИ ВСТРЕЧИ: ПУТИН ТОКАЕВ | НИКОЛАЙ ПЛАТОШКИН"
["posted_time"]=>
string(24) "14 часов назад"
["channelName"]=>
NULL
}
["bIioxQE1ow4"]=>
object(stdClass)#5526 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "bIioxQE1ow4"
["related_video_title"]=>
string(93) "Thuật toán K-Means | KMean - KMeans clustering | Khai phá dữ liệu | K-Means Algorithm"
["posted_time"]=>
string(19) "5 лет назад"
["channelName"]=>
NULL
}
["CJ4hqH7Re8E"]=>
object(stdClass)#5512 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "CJ4hqH7Re8E"
["related_video_title"]=>
string(98) "🧪🧪🧪🧪Как увидеть гиперпространство (4-е измерение)"
["posted_time"]=>
string(21) "2 года назад"
["channelName"]=>
NULL
}
["QI7oUwNrQ34"]=>
object(stdClass)#5500 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "QI7oUwNrQ34"
["related_video_title"]=>
string(86) "Цепи Маркова — математика предсказаний [Veritasium]"
["posted_time"]=>
string(23) "1 месяц назад"
["channelName"]=>
NULL
}
["RHxuUQ58yjc"]=>
object(stdClass)#5501 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "RHxuUQ58yjc"
["related_video_title"]=>
string(79) "ЭТИ АЛГОРИТМЫ СДЕЛАЮТ ИЗ ТЕБЯ ПРОГРАММИСТА"
["posted_time"]=>
string(25) "2 недели назад"
["channelName"]=>
NULL
}
["mgUGHRLN-34"]=>
object(stdClass)#5507 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "mgUGHRLN-34"
["related_video_title"]=>
string(101) "Самая Сложная Задача В Истории Самой Сложной Олимпиады"
["posted_time"]=>
string(27) "9 месяцев назад"
["channelName"]=>
NULL
}
["LwQEVNfhiwY"]=>
object(stdClass)#5508 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "LwQEVNfhiwY"
["related_video_title"]=>
string(151) "Эскорт для Путина и мужчины Матвиенко: как женщины выживают в российской политике?"
["posted_time"]=>
string(22) "22 часа назад"
["channelName"]=>
NULL
}
["0yILsvQZ0Uw"]=>
object(stdClass)#5506 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "0yILsvQZ0Uw"
["related_video_title"]=>
string(45) "Bài giảng 43: Mô hình hồi qui logistic"
["posted_time"]=>
string(20) "10 лет назад"
["channelName"]=>
NULL
}
["7cg9HYKYO1A"]=>
object(stdClass)#5504 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "7cg9HYKYO1A"
["related_video_title"]=>
string(61) "Machine Learning Cơ Bản: K-Means Clustering trong 10 PHÚT"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["gJkEZlwCbBg"]=>
object(stdClass)#5505 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "gJkEZlwCbBg"
["related_video_title"]=>
string(0) ""
["posted_time"]=>
string(24) "10 часов назад"
["channelName"]=>
NULL
}
}