Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Stochastic computational graphs: optimization and applications in NLP, Maksim Kretov

Автор: BayesGroup.ru

Загружено: 2017-12-17

Просмотров: 330

Описание:

Slides: https://bayesgroup.github.io/bmml_sem...

Using stochastic computational graphs formalism for optimization of sequence-to-sequence model
Variety of machine learning problems can be formulated as an optimization task for some (surrogate) loss function. Calculation of loss function can be viewed in terms of stochastic computational graphs (SCG). We use this formalism to analyze a problem of optimization of famous sequence-to-sequence model with attention and propose reformulation of the task. Examples are given for machine translation (MT). Our work provides a unified view on different optimization approaches for sequence-to-sequence models and could help researchers in developing new network architectures with embedded stochastic nodes.
Paper: https://arxiv.org/abs/1711.07724

Differentiable lower bound for expected BLEU score
In natural language processing tasks performance of the models is often measured with some non-differentiable metric, such as BLEU score. To use efficient gradient-based methods for optimization, it is a common workaround to optimize some surrogate loss function. This approach is effective if optimization of such loss also results in improving target metric. The corresponding problem is referred to as loss-evaluation mismatch. In the present work we propose a method for calculation of differentiable lower bound of expected BLEU score that does not involve computationally expensive sampling procedure such as the one required when using REINFORCE rule from reinforcement learning (RL) framework. Derived lower bound is tight in the sense that for degenerate distributions of candidate text it coincides with exact BLEU score, thus it is fair to refer to this lower bound as "differentiable BLEU score".
Paper: https://arxiv.org/abs/1712.04708

Stochastic computational graphs: optimization and applications in NLP, Maksim Kretov

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

КРУТИХИН: РУССКИМ НАЗНАЧИЛИ ВСТРЕЧУ В ОАЭ. Конец войны летом? Трамп открыл СОВЕТ МИРА. Что в Иране?

КРУТИХИН: РУССКИМ НАЗНАЧИЛИ ВСТРЕЧУ В ОАЭ. Конец войны летом? Трамп открыл СОВЕТ МИРА. Что в Иране?

SAMOBÓJ I 106. GOL LEWANDOWSKIEGO W LIDZE MISTRZÓW! | SLAVIA - FC BARCELONA, SKRÓT MECZU

SAMOBÓJ I 106. GOL LEWANDOWSKIEGO W LIDZE MISTRZÓW! | SLAVIA - FC BARCELONA, SKRÓT MECZU

ИГРАЕМ ТИТУЛЬНЫЙ ЧЕТВЕРГ С ХИКАРУ И МАГНУСОМ!

ИГРАЕМ ТИТУЛЬНЫЙ ЧЕТВЕРГ С ХИКАРУ И МАГНУСОМ!

Topological data analysis and machine learning [in Russian]

Topological data analysis and machine learning [in Russian]

Будущее Без РАБОТЫ и ДЕНЕГ | Либерманы

Будущее Без РАБОТЫ и ДЕНЕГ | Либерманы

ПРЯМО СЕЙЧАС: Зеленский выступает после Трампа! Путин дал ярд! Кто в Давосе был - в цирке не смеётся

ПРЯМО СЕЙЧАС: Зеленский выступает после Трампа! Путин дал ярд! Кто в Давосе был - в цирке не смеётся

On Structured Prediction Theory with Calibrated Convex Surrogate Losses, Anton Osokin

On Structured Prediction Theory with Calibrated Convex Surrogate Losses, Anton Osokin

ПОСЛЕДНИЙ ШАНС? ЧТО ЖДЕТ ИРАН, ЕСЛИ ОН НЕ ОТКАЖЕТСЯ ОТ ЯДЕРНОГО ОРУЖИЯ! СОБЫТИЯ ДНЯ. 22 января 16:00

ПОСЛЕДНИЙ ШАНС? ЧТО ЖДЕТ ИРАН, ЕСЛИ ОН НЕ ОТКАЖЕТСЯ ОТ ЯДЕРНОГО ОРУЖИЯ! СОБЫТИЯ ДНЯ. 22 января 16:00

From GPT-3 to ChatGPT: Training Language Models on Instructions and Human Feedback [in Russian]

From GPT-3 to ChatGPT: Training Language Models on Instructions and Human Feedback [in Russian]

SZOBOSZLAI WYKIWAŁ WSZYSTKICH! PEWNA WYGRANA

SZOBOSZLAI WYKIWAŁ WSZYSTKICH! PEWNA WYGRANA "THE REDS"! MARSYLIA - LIVERPOOL, SKRÓT MECZU

Квантовая механика

Квантовая механика

Дискуссионный семинар о диффузных моделях

Дискуссионный семинар о диффузных моделях

SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии

SketchBoost: быстрый бустинг для multiclass/multilabel классификации и multitask регрессии

The Singularity Timeline: AGI by 2029, Humans Merge with AI, AI Seems Conscious | Ray Kurzweil

The Singularity Timeline: AGI by 2029, Humans Merge with AI, AI Seems Conscious | Ray Kurzweil

МЕЖДУНАРОДНАЯ ОБСТАНОВКА | ПЛАТОШКИН | НОЗДРЯКОВ | ПРЯМОЙ ЭФИР 22.01.26

МЕЖДУНАРОДНАЯ ОБСТАНОВКА | ПЛАТОШКИН | НОЗДРЯКОВ | ПРЯМОЙ ЭФИР 22.01.26

Training Scale-Invariant Neural Networks on the Sphere Can Happen in Three Regimes [in Russian]

Training Scale-Invariant Neural Networks on the Sphere Can Happen in Three Regimes [in Russian]

Inauguracja Rady Pokoju. Trump podziękował Nawrockiemu

Inauguracja Rady Pokoju. Trump podziękował Nawrockiemu

Prezydent Nawrocki o Radzie Pokoju: NIE złożyłem podpisu!

Prezydent Nawrocki o Radzie Pokoju: NIE złożyłem podpisu!

Все дело в языке, а он ― меняется. И поэтому...

Все дело в языке, а он ― меняется. И поэтому...

Diffusion Models: Discussion Seminar, Part 1 [in Russian]

Diffusion Models: Discussion Seminar, Part 1 [in Russian]

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com