Classify Images with a Vision Transformer (ViT): PyTorch Deep Learning Tutorial

Автор: Luke Ditria

Загружено: 2024-06-19

Просмотров: 4674

Описание:

TIMESTAMPS
00:00 Introduction
00:28 Overview of Vision Transformers
00:43 Reference to "An Image is Worth 16x16 Words" Paper
01:50 Comparison with CNNs
03:00 Explanation of Transformer Blocks
04:41 Network Implementation
05:18 Forward Pass
07:43 Model Instantiation
08:19 Training Process
08:52 Training Results
09:12 Significance of Vision Transformers
09:31 Visualization of Positional Embeddings
10:30 Future Directions and Conclusion

In this Pytorch Tutorial video I introduce the Vision Transformer model! By simply splitting our image into patches we can use Encoder-Only Transformers to perform image classification!

An Image is Worth 16x16 words:
https://arxiv.org/pdf/2010.11929

Donations, Help Support this work!
https://www.buymeacoffee.com/lukeditria

The corresponding code is available here! ( Section 14)
https://github.com/LukeDitria/pytorch...

Discord Server:
/ discord

Classify Images with a Vision Transformer (ViT): PyTorch Deep Learning Tutorial

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Deploying Pytorch Neutral Networks On the Raspberry Pi!

Deploying Pytorch Neutral Networks On the Raspberry Pi!

Создание подписей к изображениям с помощью Transformer с нуля! Учебник по глубокому обучению PyTorch

Создание подписей к изображениям с помощью Transformer с нуля! Учебник по глубокому обучению PyTorch

Creating DEEP CNNs with ResNets: Pytorch Deep Learning Tutorial

Creating DEEP CNNs with ResNets: Pytorch Deep Learning Tutorial

ВНИМАНИЕ | Изображение стоит 16x16 слов | Vision Transformers (ViT) Объяснение и реализация

ВНИМАНИЕ | Изображение стоит 16x16 слов | Vision Transformers (ViT) Объяснение и реализация

PyTorch in 1 Hour

PyTorch in 1 Hour

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

ВНЕДРЕНИЕ ПАТЧА | Vision Transformers: объяснение

ВНЕДРЕНИЕ ПАТЧА | Vision Transformers: объяснение

350 - Efficient Image Retrieval with Vision Transformer (ViT) and FAISS

350 - Efficient Image Retrieval with Vision Transformer (ViT) and FAISS

Generative Image Diffusion from Scratch! PyTorch Deep Learning Tutorial

Generative Image Diffusion from Scratch! PyTorch Deep Learning Tutorial

Creating a Vector Quantized VAE from Scratch! PyTorch Deep Tutorial

Creating a Vector Quantized VAE from Scratch! PyTorch Deep Tutorial

Vision Transformer for Image Classification

Vision Transformer for Image Classification

Краткое руководство по Vision Transformer — теория и код за (почти) 15 минут

Краткое руководство по Vision Transformer — теория и код за (почти) 15 минут

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение

Изображение стоит 16x16 слов: Трансформеры для масштабного распознавания изображений (с пояснения...

Изображение стоит 16x16 слов: Трансформеры для масштабного распознавания изображений (с пояснения...

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Vision Transformer Basics

Vision Transformer Basics

Creating a Text Classifier With LSTM! PyTorch Deep Learning Tutorial

Creating a Text Classifier With LSTM! PyTorch Deep Learning Tutorial

Pytorch Transformers from Scratch (Attention is all you need)

Pytorch Transformers from Scratch (Attention is all you need)

Vision Transformers (ViT) pytorch code

Vision Transformers (ViT) pytorch code

Vision Transformer from Scratch Tutorial

Vision Transformer from Scratch Tutorial