Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

#055

Автор: Machine Learning Podcast

Загружено: 2024-09-26

Просмотров: 975

Описание:

Гостем выпуска стал Илья Гусев - известный NLP-специалист, сделавший большой вклад в область своими опенсорс-проектами, среди которых анализатор морфологии, генератор стихов, сборка различных датасетов и некоторые другие. Один из таких проектов как раз и стал поводом к сегодняшнему общению. Это большая языковая модель, заточенная на работу с русским языком - Сайга. Но говорим в выпуске мы далеко не только о ней. Илья сделал классный исторический экскурс в современные языковые модели, рассказал некоторые подробности об их устройстве, о тех подходах, которые применяют, чтобы такие модели можно было запускать на домашнем компьютере, как с помощью языковых моделей можно решать разные задачи и стоит ли вообще использовать локальные модели. Интересного и полезного прослушивания!

Ссылки выпуска:

Статья Ильи на Хабре "Как (быстро) сделать русский локальный ChatGPT" (https://habr.com/ru/articles/759386/)
Сервис для запуска больших языковых моделей локально - lmstudio (https://lmstudio.ai/)
Репозиторий сервиса oobabooga, с помощью которого можно запустить веб-интерфейс для работы с LLM локально (https://github.com/oobabooga/text-gen...)
Репозиторий сервиса Text Generation Inference (TGI), который позволяет развертывать и поддерживать LLM (https://github.com/huggingface/text-g...)
Статья на arxiv "Self-Consuming Generative Models Go MAD" с анализом того, к чему приводят разные подходы обучения LLM на синтетических датасетах, сгенерированных другими LLM (https://arxiv.org/abs/2307.01850)
Пост Ильи со списком материалов для погружения в NLP (https://t.me/natural_language_process...)

Выпуск подкаста на mawe - https://mlpodcast.mave.digital/ep-55
Все выпуски подкаста на mawe - https://mlpodcast.mave.digital
Подкаст на Apple Podcasts - https://podcasts.apple.com/ru/podcast...
Подкаст на Google Подкастах - https://podcasts.google.com/feed/aHR0...
Подкаст в Яндекс Музыке - https://music.yandex.ru/album/9781458
Паблик подкаста ВКонтакте - https://vk.com/mlpodcast

Телеграм-канал "Стать специалистом по машинному обучению" - https://t.me/toBeAnMLspecialist
Чат в телеграм, где можно обсудить выпуски, предложить гостей и темы подкаста и просто пообщаться (https://t.me/MachineLearningPodcast)

Телеграм автора подкаста - @kmsint

Бесплатный курс по созданию телеграм-ботов на Python и aiogram от автора подкаста - https://stepik.org/course/120924/
Продвинутый курс по созданию телеграм-ботов на Python - https://stepik.org/a/153850

Поблагодарить автора подкаста можно добрым словом и/или донатом: https://www.tinkoff.ru/rm/kryzhanovsk...

#055

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

#052 ML Юрий Кацер. Анализ и прогнозирование временных рядов и можно ли зарабатывать с их помощью

#052 ML Юрий Кацер. Анализ и прогнозирование временных рядов и можно ли зарабатывать с их помощью

#056 ML Юрий Окуловский. Гаражные стартапы в условиях бигбиза

#056 ML Юрий Окуловский. Гаражные стартапы в условиях бигбиза

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Мурат Апишев | Как обучать большие языковые модели

Мурат Апишев | Как обучать большие языковые модели

#047 ML Татьяна Гайнцева. О научной работе и будущем человечества в конкуренции с ИИ

#047 ML Татьяна Гайнцева. О научной работе и будущем человечества в конкуренции с ИИ

Дрессировка открытых языковых моделей | Илья Гусев в ЛЕЯ

Дрессировка открытых языковых моделей | Илья Гусев в ЛЕЯ

Он работал в OpenAI. Теперь он предупреждает: «Вы даже не представляете, что скоро начнётся!»

Он работал в OpenAI. Теперь он предупреждает: «Вы даже не представляете, что скоро начнётся!»

#054 ML Валерий Бабушкин и Арсений Кравченко. Как написать книгу об ML System Design

#054 ML Валерий Бабушкин и Арсений Кравченко. Как написать книгу об ML System Design

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Маленькие большие языковые модели

Маленькие большие языковые модели

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

Экономика LLM: что надо и сколько стоит использование больших языковых моделей

Почему Азовское море — самое опасное в мире

Почему Азовское море — самое опасное в мире

Серебряная лихорадка в Китае: цены взлетают, покупатели занимают деньги и продают жильё

Серебряная лихорадка в Китае: цены взлетают, покупатели занимают деньги и продают жильё

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

Илья Гусев - Синтетические датасеты как способ сокращения неравенства

Илья Гусев - Синтетические датасеты как способ сокращения неравенства

Я установил DeepSeek ЛОКАЛЬНО! Вот что из этого вышло...

Я установил DeepSeek ЛОКАЛЬНО! Вот что из этого вышло...

НОВЫЙ ДВОРЕЦ ПУТИНА. Показываем, что там внутри

НОВЫЙ ДВОРЕЦ ПУТИНА. Показываем, что там внутри

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

Нейронка, которая УНИЧТОЖИЛА ChatGPT 5! / Обзор бесплатной нейросети и ее возможности

#061 ML Александр Алерон Миленькин. Надо ли строить бизнес вокруг ML

#061 ML Александр Алерон Миленькин. Надо ли строить бизнес вокруг ML

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]