Django и HTMX #18 — Автоматическая фильтрация спама / Машинное обучение с помощью Scikit-Learn
Автор: BugBytes
Загружено: 2022-05-04
Просмотров: 3419
▶ ПОЛНЫЙ КУРС Django и HTMX: https://www.udemy.com/course/django-h...
В этом видео мы создадим автоматизированный спам-фильтр, который поможет администраторам обнаруживать и удалять спам-комментарии на вашем сайте Django.
Для начала мы построим модель машинного обучения с помощью pandas и scikit-learn. Мы постараемся упростить задачу, используя модель K-ближайших соседей и векторизовав текст с помощью TfidfVectorizer.
После создания и оценки модели мы применим её к нашему приложению Django, создав модель комментариев и пропустив текст каждого комментария через нашу модель машинного обучения. Мы будем использовать HTMX для обновления нашего фронтенда, добавив частичный код, указывающий, отмечен ли данный комментарий как потенциальный спам, и позволим администраторам удалять комментарии с помощью HTMX-запросов.
Мы также кратко рассмотрим, как HTMX можно использовать в качестве инструмента для написания скриптов, аналогичного jQuery. Мы будем использовать возможности HTMX для написания скриптов, чтобы удалять строку из DOM при удалении комментария, а не возвращать отдельный частичный код.
Стартовый код можно найти здесь: https://github.com/bugbytes-io/django...
📌 𝗖𝗵𝗮𝗽𝘁𝗲𝗿𝘀:
00:00 Введение
04:00 Предварительная обработка текста
07:08 Векторизация текста с помощью Scikit-Learn TfidfVectorizer
09:10 Разделение данных на обучающий и тестовый наборы
10:28 Обучение классификатора Scikit-Learn KNN
12:00 Сохранение модели в файл
13:18 Добавление модели комментариев Django
15:22 Добавление комментариев с помощью Django Admin
18:40 Добавление обнаружения спама с помощью HTMX
28:14 Удаление сообщений с помощью HTMX
31:42 Удаление строки с помощью скрипта HTMX инструменты
☕️ 𝗕𝘂𝘆 𝗺𝗲 𝗮 𝗰𝗼𝗳𝗳𝗲𝗲:
Чтобы поддержать канал и вдохновить на новые видео, пожалуйста, угостите меня кофе здесь:
https://ko-fi.com/bugbytes
𝗦𝗼𝗰𝗶𝗮𝗹 𝗠𝗲𝗱𝗶𝗮:
📖 Блог: https://www.bugbytes.io/posts/
👾 Github: https://github.com/bugbytes-io/django...
🐦 Twitter: / bugbytesio
📚 𝗙𝘂𝗿𝘁𝗵𝗲𝗿 𝗿𝗲𝗮𝗱𝗶𝗻𝗴 𝗮𝗻𝗱 𝗶𝗻𝗳𝗼𝗿𝗺𝗮𝘁𝗶𝗼𝗻:
Набор данных: https://www.kaggle.com/datasets/karth...
KNN: https://scikit-learn.org/stable/modul...
TF-IDF: https://scikit-learn.org/stable/modul...
Сохранение модели: https://scikit-learn.org/stable/modul...
Точность и полнота: https://en.wikipedia.org/wiki/Precisi...
Карточки TailwindCSS: https://tailwind-elements.com/docs/st...
HTMX 204 Без контента: https://htmx.org/docs/#requests
HTMX-скриптинг и JS API: https://htmx.org/reference/#api
#python #django #machinelearning #sklearn #htmx #pandas
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: