Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Applied Deep Learning 2025 - Lecture 8 - Transformers

Автор: Alexander Pacha

Загружено: 2025-11-18

Просмотров: 77

Описание:

In this lecture, we're diving into Transformers, which not only sound really cool, but have become a real game-changer, especially for sequence modeling like machine translation or text generation. The main driver behind transformers is the attention mechanism, which we will explore in detail. Some even say "Attention is all you need" - Let me know in the comments, if you agree with this statement, or rather with my reference.

Complete Playlist:    • Applied Deep Learning 2025 - Lecture 0 - P...  

00:00:00 - Start
00:00:40 - Recap
00:03:53 - Why Transformers?
00:09:36 - What is a Transformer?
00:11:10 - Input Embedding and Positional Encoding
00:14:20 - Attention
00:17:12 - Implementing Attention
00:21:34 - Masked Attention
00:24:06 - Cross-Attention
00:25:51 - The final layers
00:27:38 - Architecture Variations
00:30:11 - Transformers for Object Detection
00:36:28 - The Detection Transformer (DETR)
00:38:02 - Bipartite Matching Loss
00:47:33 - Object Queries
00:55:14 - Advances in Transformers
01:01:48 - Summary

== Literature ==
1. Halthor, Transformer Neural Networks Explained, 2020
2. Vaswani et al., Attention Is All You Need, 2017
3. Carion et al. End-to-End Object Detection with Transformers, 2020
4. Kilcher, End-to-End Object Detection with Transformers (Paper explanation), 2020
5. Pacha et al., A Baseline for General Music Object Detection with Deep Learning, 2018
6. Parmar et al. Image Transformer, 2018
7. Kilcher, Attention Is All You Need (Explained), 2017
8. Phi, Illustrated Guide to Transformers: Step by Step Explanation, 2020
9. Olah et al. Attention and Augmented Recurrent Neural Networks, 2016
10. Peters et al. Deep contextualized word representations, 2018
11. Howard et al. Universal Language Model Fine-tuning for Text Classification, 2018
12. Devlin et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, 2018
13. Kitaev et al. Reformer: The Efficient Transformer, 2020
14. Wang et al. Linformer: Self-Attention with Linear Complexity, 2020
15. Wu et al. Pay less attention with Lightweight and Dynamic Convolutions, 2019
16. Dosovitskiy et al. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, 2021
17. Liu et al. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows, 2021
18. Liu et al. Swin Transformer V2: Scaling Up Capacity and Resolution, 2022
19. Sun et al. Rethinking Transformer-based Set Prediction for Object Detection, 2021
20. Gildenblat, Exploring Explainability for Vision Transformers, 2021

Applied Deep Learning 2025 - Lecture 8 - Transformers

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Applied Deep Learning 2025 - Lecture 9 - Preprocessing, Augmentation, Regularization, Visualization

Applied Deep Learning 2025 - Lecture 9 - Preprocessing, Augmentation, Regularization, Visualization

Applied Deep Learning 2025 - Lecture 10 - Explainable AI

Applied Deep Learning 2025 - Lecture 10 - Explainable AI

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Applied Deep Learning 2025 - Lecture 7 - Autoencoders and Generative Adversarial Networks (GANs)

Applied Deep Learning 2025 - Lecture 7 - Autoencoders and Generative Adversarial Networks (GANs)

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Transformers Explained | Simple Explanation of Transformers

Transformers Explained | Simple Explanation of Transformers

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Applied Deep Learning 2025 - Lecture 6 - Deep Reinforcement Learning

Applied Deep Learning 2025 - Lecture 6 - Deep Reinforcement Learning

Stanford CS230 | Autumn 2025 | Lecture 1: Introduction to Deep Learning

Stanford CS230 | Autumn 2025 | Lecture 1: Introduction to Deep Learning

Объяснение Transformers: понимание модели, лежащей в основе GPT, BERT и T5

Объяснение Transformers: понимание модели, лежащей в основе GPT, BERT и T5

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Applied Deep Learning 2025 - Lecture 11 - Graph Neural Networks

Applied Deep Learning 2025 - Lecture 11 - Graph Neural Networks

МФТИ – как учат ГЕНИЕВ? Полнометражный фильм

МФТИ – как учат ГЕНИЕВ? Полнометражный фильм

Внимание — это все, что вам нужно

Внимание — это все, что вам нужно

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Applied Deep Learning 2025 - Lecture 1 - Introduction to Deep Learning

Applied Deep Learning 2025 - Lecture 1 - Introduction to Deep Learning

CS480/680 Lecture 19: Attention and Transformer Networks

CS480/680 Lecture 19: Attention and Transformer Networks

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]