Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Могут ли SLM хорошо говорить? Дистилляция, RLFT и агенты реального мира (с Фернандо)

Автор: Abhishek Thakur

Загружено: 2025-10-28

Просмотров: 3690

Описание:

В этом выпуске «Беседы об ИИ» мы беседуем с Фернандо из Liquid AI, чтобы разобраться в развитии малых языковых моделей (SLM) и почему архитектура и данные теперь важнее, чем простое количество параметров. Мы рассмотрим гибридные преобразователи/свёрточные модели, поиск на основе нейронной архитектуры (NAS) и то, как сделать модели компактнее, быстрее и эффективнее, чтобы они могли работать локально на потребительских видеокартах или современных ноутбуках, не жертвуя производительностью.

Фернандо делится опытом, полученным в ходе пред- и пост-обучения: почему качество данных — это главное, когда оптимизаторы, такие как Adam, а не Muon, показывают лучшие результаты (в зависимости от архитектуры!), и практическими методами, такими как заморозка слоёв (Spectrum) и компромиссы LoRA. Мы подробно рассмотрим дистилляцию (сопоставление токенов и скрытых состояний), реалии RLFT для SLM и перспективы развития агентного ИИ на устройствах: представьте себе персональных офлайн-помощников, которые действительно управляют вашей электронной почтой, календарём, исследованиями и многим другим.

Подпишитесь и поставьте лайк, чтобы мотивировать меня снимать такие же потрясающие видео. :)

Подписывайтесь на меня:
Twitter:   / abhi1thakur  
LinkedIn:   / abhi1thakur  
Kaggle: https://kaggle.com/abhishek

Могут ли SLM хорошо говорить? Дистилляция, RLFT и агенты реального мира (с Фернандо)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(20) { ["_doSjv_z9xI"]=> object(stdClass)#6281 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "_doSjv_z9xI" ["related_video_title"]=> string(131) "«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме" ["posted_time"]=> string(24) "20 часов назад" ["channelName"]=> NULL } ["JuByWhsa2mU"]=> object(stdClass)#6303 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "JuByWhsa2mU" ["related_video_title"]=> string(138) ""Высокий холестерин не болит, он просто тихо убивает". Профессор №1 Арутюнов" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["osKyvYJ3PRM"]=> object(stdClass)#6282 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "osKyvYJ3PRM" ["related_video_title"]=> string(58) "Large Language Models (LLMs) - Everything You NEED To Know" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["wjZofJX0v4M"]=> object(stdClass)#6297 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "wjZofJX0v4M" ["related_video_title"]=> string(148) "LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["1VBeE5BfhPM"]=> object(stdClass)#6283 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "1VBeE5BfhPM" ["related_video_title"]=> string(47) "Kill Generic Metrics: The Right Way to Judge AI" ["posted_time"]=> string(65) "Трансляция закончилась 6 дней назад" ["channelName"]=> NULL } ["PjqGbEE7EYc"]=> object(stdClass)#6304 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "PjqGbEE7EYc" ["related_video_title"]=> string(43) "What is Artificial Superintelligence (ASI)?" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["5YBSypM1-u0"]=> object(stdClass)#6289 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "5YBSypM1-u0" ["related_video_title"]=> string(65) "Inside Google AI Studio with Logan - The Future of AI Development" ["posted_time"]=> string(63) "Трансляция закончилась 2 дня назад" ["channelName"]=> NULL } ["qYNweeDHiyU"]=> object(stdClass)#6291 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "qYNweeDHiyU" ["related_video_title"]=> string(63) "AI, Machine Learning, Deep Learning and Generative AI Explained" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["kPFeJ9saR58"]=> object(stdClass)#6286 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "kPFeJ9saR58" ["related_video_title"]=> string(89) "Развитие потенциала мозга. Татьяна Черниговская" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["aircAruvnKk"]=> object(stdClass)#6306 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "aircAruvnKk" ["related_video_title"]=> string(101) "Но что такое нейронная сеть? | Глава 1. Глубокое обучение" ["posted_time"]=> string(19) "8 лет назад" ["channelName"]=> NULL } ["DR4JdKINBzk"]=> object(stdClass)#6288 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "DR4JdKINBzk" ["related_video_title"]=> string(170) "БЫКОВ: Путина растерзают. Stoptime — гордость. Совет Пугачевой. Лавров в опале. Симоньян обманула" ["posted_time"]=> string(20) "21 час назад" ["channelName"]=> NULL } ["NnSLKfJGvCA"]=> object(stdClass)#6298 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "NnSLKfJGvCA" ["related_video_title"]=> string(175) "Интервью сбежавшего офицера. Правда об армии России: мясные штурмы, обнуления, беспредел | ДОСЬЕ" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } ["LwQEVNfhiwY"]=> object(stdClass)#6284 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "LwQEVNfhiwY" ["related_video_title"]=> string(151) "Эскорт для Путина и мужчины Матвиенко: как женщины выживают в российской политике?" ["posted_time"]=> string(24) "20 часов назад" ["channelName"]=> NULL } ["7ywFsGmU66I"]=> object(stdClass)#6272 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "7ywFsGmU66I" ["related_video_title"]=> string(107) "Путь от не-технолога до мета-инженера с Андреем Лукьяненко" ["posted_time"]=> string(67) "Трансляция закончилась 1 месяц назад" ["channelName"]=> NULL } ["5mY71rGXAkM"]=> object(stdClass)#6273 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "5mY71rGXAkM" ["related_video_title"]=> string(61) "π0: A Foundation Model for Robotics with Sergey Levine - 719" ["posted_time"]=> string(27) "8 месяцев назад" ["channelName"]=> NULL } ["eiMkVzcEjo4"]=> object(stdClass)#6279 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "eiMkVzcEjo4" ["related_video_title"]=> string(170) "ОРЕШКИН: "Облавы начались, но..". Кого ловят в РФ, что нужно Кремлю, Песков выдал это, где ЛАВРОВ" ["posted_time"]=> string(24) "15 часов назад" ["channelName"]=> NULL } ["KdZ4HF1SrFs"]=> object(stdClass)#6280 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "KdZ4HF1SrFs" ["related_video_title"]=> string(51) "Алгоритмы на Python 3. Лекция №1" ["posted_time"]=> string(19) "8 лет назад" ["channelName"]=> NULL } ["x7oKJl6tDG4"]=> object(stdClass)#6278 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "x7oKJl6tDG4" ["related_video_title"]=> string(62) "How to Stay Relevant in AI & Data Science (w/ Alexey Grigorev)" ["posted_time"]=> string(69) "Трансляция закончилась 2 недели назад" ["channelName"]=> NULL } ["m2IuJAYyrY4"]=> object(stdClass)#6276 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "m2IuJAYyrY4" ["related_video_title"]=> string(158) "Спокойная классика | Бах, Бетховен, Шопен, Дебюсси, Лист, Мендельсон, Моцарт, Сати, Шуман" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["etvBkp6zLqw"]=> object(stdClass)#6277 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "etvBkp6zLqw" ["related_video_title"]=> string(0) "" ["posted_time"]=> string(67) "Трансляция закончилась 9 часов назад" ["channelName"]=> NULL } }
«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме

«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме

"Высокий холестерин не болит, он просто тихо убивает". Профессор №1 Арутюнов

Large Language Models (LLMs) - Everything You NEED To Know

Large Language Models (LLMs) - Everything You NEED To Know

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Kill Generic Metrics: The Right Way to Judge AI

Kill Generic Metrics: The Right Way to Judge AI

What is Artificial Superintelligence (ASI)?

What is Artificial Superintelligence (ASI)?

Inside Google AI Studio with Logan - The Future of AI Development

Inside Google AI Studio with Logan - The Future of AI Development

AI, Machine Learning, Deep Learning and Generative AI Explained

AI, Machine Learning, Deep Learning and Generative AI Explained

Развитие потенциала мозга. Татьяна Черниговская

Развитие потенциала мозга. Татьяна Черниговская

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

БЫКОВ: Путина растерзают. Stoptime — гордость. Совет Пугачевой. Лавров в опале. Симоньян обманула

БЫКОВ: Путина растерзают. Stoptime — гордость. Совет Пугачевой. Лавров в опале. Симоньян обманула

Интервью сбежавшего офицера. Правда об армии России: мясные штурмы, обнуления, беспредел | ДОСЬЕ

Интервью сбежавшего офицера. Правда об армии России: мясные штурмы, обнуления, беспредел | ДОСЬЕ

Эскорт для Путина и мужчины Матвиенко: как женщины выживают в российской политике?

Эскорт для Путина и мужчины Матвиенко: как женщины выживают в российской политике?

Путь от не-технолога до мета-инженера с Андреем Лукьяненко

Путь от не-технолога до мета-инженера с Андреем Лукьяненко

π0: A Foundation Model for Robotics with Sergey Levine - 719

π0: A Foundation Model for Robotics with Sergey Levine - 719

ОРЕШКИН:

ОРЕШКИН: "Облавы начались, но..". Кого ловят в РФ, что нужно Кремлю, Песков выдал это, где ЛАВРОВ

Алгоритмы на Python 3. Лекция №1

Алгоритмы на Python 3. Лекция №1

How to Stay Relevant in AI & Data Science (w/ Alexey Grigorev)

How to Stay Relevant in AI & Data Science (w/ Alexey Grigorev)

Спокойная классика | Бах, Бетховен, Шопен, Дебюсси, Лист, Мендельсон, Моцарт, Сати, Шуман

Спокойная классика | Бах, Бетховен, Шопен, Дебюсси, Лист, Мендельсон, Моцарт, Сати, Шуман

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]