Онлайн-мітап з Андрієм Рижим: Чи дійсно Vision Transformers замінюють класичні CNN?
Автор: Data Science UA
Загружено: 2025-05-12
Просмотров: 226
Наш спікер – Андрій Рижий, МL Lead Engineer в українській продуктовій IT-компанії Skylum. Останні 6 років працює у сфері AI й спеціалізується на дослідженні та імплементації методів обробки зображень, а саме: задачах з сегментації, детекції, depth estimation, img2img та ін.
Під час мітапу Андрій детально розкаже про архітектурні відмінності CNN та Vision Transformer, а також пояснить, як Skylum обирає архітектуру залежно від задач, продукту та можливостей девайса користувача, забезпечуючи баланс між точністю та швидкістю обробки зображень.
Ключові тези мітапу:
🔹Огляд CNN: архітектура, еволюція (від AlexNet до EfficientNet), переваги та недоліки
🔹Огляд Vision Transformers: принцип роботи, механізм self-attention, порівняння з конволюціями
🔹Приклади моделей: від першого ViT до сучасного і швидкого FastViT
🔹CNN vs. ViT: порівняння принципів роботи, швидкодії та складності запуску моделей локально
🔹Досвід Skylum: де компанія використовує CNN, а де й чому — ViT?
Цей мітап буде корисним для всіх, хто прагне дізнатися більше про сучасні методи обробки зображень завдяки AI, а також хоче розв'язати дилему, яку архітектуру доцільніше обрати для розвитку власного проєкту.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: