Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Представление текста в цифровом виде для нейросети | Нейросети для анализа текстов

Автор: Andrey Sozykin

Загружено: 2019-08-24

Просмотров: 19436

Описание:

В видео рассматриваются различные методы токенизации и векторизации текста для представления его в виде, пригодном для обработки нейросетью. Страница курса - https://www.asozykin.ru/courses/nnpython

Нейронные сети могут работать только с числами. Поэтому перед обработкой текста нейронной сетью, его нужно конвертировать в набор чисел. Для этого используется два шага:
1. Токенизация - разделение текста на отдельные части: символы, слова, предложения.
2. Векторизация - представление каждого токена в виде чисел: кода или вектора (one hot encoding или embedding).

Предварительно обученные плотные векторные представления слов:
1. GloVe (Global Vectors) - https://nlp.stanford.edu/projects/glove/
2. Word2Vec, Google - https://code.google.com/archive/p/wor...
3. FastText, Facebook - https://fasttext.cc

Плотные векторные представления слов для русского языка:
1. RusVectōrēs – https://rusvectores.org
2. RUSSE (Russian Semantic Evaluation) – https://russe.nlpub.org/downloads/

Tomas Mikolov, Wen-tau Yih, Geoffrey Zweig. Linguistic Regularities in Continuous Space Word Representations - https://www.microsoft.com/en-us/resea...

Как можно поддержать курс:
1. Яндекс Кошелек - https://money.yandex.ru/to/4100142982...
2. PayPal - https://www.paypal.me/asozykin
Заранее спасибо за помощь!

Добавляйтесь в друзья в социальных сетях:
вКонтакте - https://vk.com/avsozykin
Instagram -   / sozykin_andr  
Facebook -   / asozykin  
Twitter -   / andreysozykin  

Мой сайт - https://www.asozykin.ru

Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках -    / andreysozykincs  

Представление текста в цифровом виде для нейросети | Нейросети для анализа текстов

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Анализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстов

Анализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстов

Word embeddings для векторизации текста | Обработка естественного языка

Word embeddings для векторизации текста | Обработка естественного языка

Рекуррентные нейросети | Нейросети для анализа текстов

Рекуррентные нейросети | Нейросети для анализа текстов

Представление текста вектором One Hot Encoding | Нейросети для анализа текстов

Представление текста вектором One Hot Encoding | Нейросети для анализа текстов

Прикладное машинное обучение 1. Intro to NLP. Word embeddings

Прикладное машинное обучение 1. Intro to NLP. Word embeddings

Классификация текстов нейросетями | Нейросети для анализа текстов

Классификация текстов нейросетями | Нейросети для анализа текстов

Векторизация текстов на естественном языке

Векторизация текстов на естественном языке

[DeepLearning | видео 1] Что же такое нейронная сеть?

[DeepLearning | видео 1] Что же такое нейронная сеть?

Нейронные сети для обработки естественного языка | Нейросети для анализа текстов

Нейронные сети для обработки естественного языка | Нейросети для анализа текстов

⚡️ Зеленский пожелал Путину смерти || Спецслужбы зашли в Москву

⚡️ Зеленский пожелал Путину смерти || Спецслужбы зашли в Москву

Векторные представления текстов и графов. Word2Vec. FastText. Модели внимания и трансформеры. BERT

Векторные представления текстов и графов. Word2Vec. FastText. Модели внимания и трансформеры. BERT

Рассчитываем контекстную близость слов с помощью библиотеки Word2vec

Рассчитываем контекстную близость слов с помощью библиотеки Word2vec

Альбина Ахметгареева | Делаем суммаризацию текстов на русском языке

Альбина Ахметгареева | Делаем суммаризацию текстов на русском языке

КАК РАБОТАЕТ WORD2VEC И ПОЧЕМУ ОН НЕ РАБОТАЕТ

КАК РАБОТАЕТ WORD2VEC И ПОЧЕМУ ОН НЕ РАБОТАЕТ

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Как работает ChatGPT: объясняем нейросети просто

Как работает ChatGPT: объясняем нейросети просто

ВСЕ НЕЙРОСЕТИ В Одном Месте / Наш Главный ИИ в Продакшене

ВСЕ НЕЙРОСЕТИ В Одном Месте / Наш Главный ИИ в Продакшене

Классификация текста: быстрые методы решения популярной задачи / Павел Калайдин

Классификация текста: быстрые методы решения популярной задачи / Павел Калайдин

Сети LSTM и GRU | Нейросети для анализа текстов

Сети LSTM и GRU | Нейросети для анализа текстов

ХОДОРКОВСКИЙ: Война скоро закончится. Россия не встанет с дивана. Путин и риски. Что с оппозицией

ХОДОРКОВСКИЙ: Война скоро закончится. Россия не встанет с дивана. Путин и риски. Что с оппозицией

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]