Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

On Merging and MoErging Models and Modules - Ivan Vulić (University of Cambridge / Google DeepMind)

Автор: HiTZ zentroa

Загружено: 2025-12-23

Просмотров: 12

Описание:

Summary:

Despite recent tendencies towards building large "monolithic" neural models, fine-tuned expert models and parameter-efficient specialised modules still offer gains over large monoliths in specific tasks and for specific data distributions (e.g., low-resource languages or specialised domains). Moreover, such modularisation of skills and expertise into dedicated models or modules allows for asynchronous, decentralised, and more efficient continuous model development, as well as module reusability. However, a central question remains: how to combine and compose these modules to enable positive transfer, sample-efficient learning, and improved out-of-domain generalisation. In this talk, after discussing the key advantages of modularisation and modular specialisation, I will provide an overview of prominent module and model composition strategies. I will focus on composition at the parameter level (model merging) and functional level (model MoErging), and then illustrate the usefulness of these techniques across several applications.

On Merging and MoErging Models and Modules - Ivan Vulić (University of Cambridge / Google DeepMind)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

Вся память интернета: петабайты ОЗУ в БОЛЬШОМ обзоре дата-центра

Вся память интернета: петабайты ОЗУ в БОЛЬШОМ обзоре дата-центра

Почему простые числа образуют эти спирали? | Теорема Дирихле и пи-аппроксимации

Почему простые числа образуют эти спирали? | Теорема Дирихле и пи-аппроксимации

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Как исследуют невидимое: темная энергия, темное вещество и черные дыры. Сергей Попов

Как исследуют невидимое: темная энергия, темное вещество и черные дыры. Сергей Попов

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Теорема Байеса, геометрия изменения убеждений

Теорема Байеса, геометрия изменения убеждений

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Темная сторона всего. Обсудим с Михаилом Зыгарем

Темная сторона всего. Обсудим с Михаилом Зыгарем

Собеседование при поступлении на факультет математики Кембриджского университета

Собеседование при поступлении на факультет математики Кембриджского университета

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Stanford CME295 Transformers & LLMs | Autumn 2025 | Lecture 1 - Transformer

Secure Web Browsing - Computerphile

Secure Web Browsing - Computerphile

A Visual Guide to Mixture of Experts (MoE) in LLMs

A Visual Guide to Mixture of Experts (MoE) in LLMs

Как создать степень магистра права с нуля | Обзор

Как создать степень магистра права с нуля | Обзор

Deep Dive into LLMs like ChatGPT

Deep Dive into LLMs like ChatGPT

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]