Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Timo Schick | Toolformer: Language Models Can Teach Themselves to Use Tools

Автор: Harvard CMSA

Загружено: 2023-04-26

Просмотров: 3050

Описание:

New Technologies in Mathematics Seminar

Speaker: Timo Schick, Meta AI

Title: Toolformer: Language Models Can Teach Themselves to Use Tools

Abstract: Language models exhibit remarkable abilities to solve new tasks from just a few examples or textual instructions, especially at scale. They also, paradoxically, struggle with basic functionality, such as arithmetic or factual lookup, where much simpler and smaller models excel. In this talk, we show how these limitations can be overcome by letting language models teach themselves to use external tools via simple APIs. We discuss Toolformer, a model trained to independently decide which APIs to call, when to call them, what arguments to pass, and how to best incorporate the results into future token prediction. Through this, it achieves substantially improved zero-shot performance across a variety of downstream tasks without sacrificing its core language modeling abilities.

Timo Schick | Toolformer: Language Models Can Teach Themselves to Use Tools

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Jimmy Ba | How to steer foundation models?

Jimmy Ba | How to steer foundation models?

Magazyn Anity Gargas: Pupil III RP pod ochroną? Emerytka potraktowana jak przestępca

Magazyn Anity Gargas: Pupil III RP pod ochroną? Emerytka potraktowana jak przestępca

"Reflexion: Language Agents with Verbal Reinforcement Learning" Noah Shinn | AI4Code Meetup

Алекс Дамиан | Понимание оптимизации в глубоком обучении с использованием центральных потоков

Алекс Дамиан | Понимание оптимизации в глубоком обучении с использованием центральных потоков

Zhigang Yao | Interaction of Statistics and Geometry: A New Landscape for Data Science

Zhigang Yao | Interaction of Statistics and Geometry: A New Landscape for Data Science

Meta AI | Language Models Can Teach Themselves to Use Tools

Meta AI | Language Models Can Teach Themselves to Use Tools

Ep#15 Navigation World Models

Ep#15 Navigation World Models

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

Andrea Montanari | Self-induced regularization from linear regression to neural networks

Andrea Montanari | Self-induced regularization from linear regression to neural networks

"TALM: Tool Augmented Language Models" Aaron Parisi (Google DeepMind) | AI4Code Meetup

Мадху Судан | Проблема P и NP: экзистенциальный вопрос математики

Мадху Судан | Проблема P и NP: экзистенциальный вопрос математики

The Singularity Countdown: AGI by 2029, Humans Merge with AI, Intelligence 1000x | Ray Kurzweil

The Singularity Countdown: AGI by 2029, Humans Merge with AI, Intelligence 1000x | Ray Kurzweil

Stanford CS224N NLP with Deep Learning | Spring 2022 | Guest Lecture: Scaling Language Models

Stanford CS224N NLP with Deep Learning | Spring 2022 | Guest Lecture: Scaling Language Models

Eliciting Secret Knowledge from Language Models by Bartosz Cywiński

Eliciting Secret Knowledge from Language Models by Bartosz Cywiński

Ронг Ма | Современные нелинейные методы встраивания: подробное описание

Ронг Ма | Современные нелинейные методы встраивания: подробное описание

Gary Marcus on the Massive Problems Facing AI & LLM Scaling | The Real Eisman Playbook Episode 42

Gary Marcus on the Massive Problems Facing AI & LLM Scaling | The Real Eisman Playbook Episode 42

Ключи к пониманию ReAct: синергия рассуждений и действий в языковых моделях

Ключи к пониманию ReAct: синергия рассуждений и действий в языковых моделях

Стив Маррон | Интеграция данных посредством анализа многообразий (DIVAM)

Стив Маррон | Интеграция данных посредством анализа многообразий (DIVAM)

Эзра Миллер | Извлечение длин стержней из многопараметрической персистентной гомологии

Эзра Миллер | Извлечение длин стержней из многопараметрической персистентной гомологии

Matilda Delgado | Dualities and the Compactifiability of Moduli Space

Matilda Delgado | Dualities and the Compactifiability of Moduli Space

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com