Обзор | Введение в текстовую аналитику с помощью R | Часть 1 |
Автор: Data Science Dojo
Загружено: 2017-06-05
Просмотров: 155681
Эта серия видеоуроков по науке о данных знакомит зрителей с захватывающим миром текстовой аналитики с использованием программирования на языке R. Как показывает популярность блогов и социальных сетей, текстовые данные не угасают — их объём растёт экспоненциально! Неудивительно, что знание текстовой аналитики критически важно для специалистов по данным, если весь этот объём информации должен быть собран и интегрирован в информационные продукты. Этот обучающий курс по науке о данных содержит вводное описание следующих инструментов и методов:
– Токенизация, стемминг и n-граммы
– Модели «мешка слов» и векторного пространства
– Разработка признаков для текстовых данных (например, косинусное сходство между документами)
– Извлечение признаков с помощью сингулярного разложения (SVD)
– Обучение моделей классификации с использованием текстовых данных
– Оценка точности обученных моделей классификации
Обзор этой серии видеоуроков представляет собой введение в текстовую аналитику в целом и то, чего следует ожидать от обучения. В книге также подробно рассматриваются следующие темы:
– Обзор набора спам-данных, используемого в серии
– Загрузка данных и первоначальная очистка данных
– Некоторый начальный анализ данных, проектирование признаков и визуализация данных
Набор данных Kaggle:
https://www.kaggle.com/uciml/sms-spam...
Данные и код R, используемые в этой серии, доступны здесь:
https://code.datasciencedojo.com/data...
Содержание:
0:00 Введение
11:06 Пакеты
13:21 Чтение CSV
17:04 Поиск недостающих данных
19:05 Исследование данных
23:14 Длина текста
--
В Data Science Dojo мы убеждены, что наука о данных доступна каждому. Наши тренинги по науке о данных прошли более 10 000 сотрудников из более чем 2500 компаний по всему миру, включая многих лидеров в сфере технологий, таких как Microsoft, Google и Facebook. Подробнее на сайте: https://hubs.la/Q01Z-13k0
💼 Научитесь создавать приложения на базе LLM всего за 40 часов в нашем учебном лагере по большим языковым моделям: https://hubs.la/Q01ZZGL-0
💼 Начните свой путь в мире данных в нашем высокорейтинговом учебном лагере по науке о данных: https://hubs.la/Q01ZZDpt0
💼 Освойте Python для науки о данных, аналитики, машинного обучения и инженерии данных: https://hubs.la/Q01ZZD-s0
💼 Исследуйте, анализируйте и визуализируйте данные с помощью Power BI Desktop: https://hubs.la/Q01ZZF8B0
--
Раскройте свой потенциал в науке о данных БЕСПЛАТНО! Погрузитесь в наши обучающие материалы, мероприятия и курсы уже сегодня!
📚 Изучите основы науки о данных и аналитики с помощью наших обучающих материалов: https://hubs.la/Q01ZZJJK0
📚 Будьте в курсе последних новостей в области науки о данных, подпишитесь на нашу рассылку прямо сейчас: https://hubs.la/Q01ZZBy10
📚 Общайтесь с другими специалистами по науке о данных и специалистами по искусственному интеллекту на наших мероприятиях сообщества: https://hubs.la/Q01ZZLd80
📚 Ознакомьтесь с нашими бесплатными курсами по науке о данных: https://hubs.la/Q01ZZMcm0
📚 Получайте ежедневную порцию знаний по науке о данных в наших популярных блогах: https://hubs.la/Q01ZZMWl0
--
📱 Ссылки на социальные сети
Свяжитесь с нами: / data-science-dojo
Подпишитесь на нас: / datasciencedojo
Будьте в курсе событий: / data_science_dojo
Подпишитесь на нас: / datasciencedojo
Найдите нас: https://www.threads.net/@data_science...
--
Также присоединяйтесь к нашим сообществам:
LinkedIn: / 13601597
Twitter: / 1677363761399865344
Facebook: / aiandmachinelearningforeveryone
Vimeo: https://vimeo.com/datasciencedojo
Discord: / discord
_
Хотите поделиться своими знаниями в области науки о данных? Расширяйте свой профиль и делитесь знаниями с нашим сообществом: https://hubs.la/Q01ZZNCn0
#textanalytics #rprogramming
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: