Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Ishan Misra: General purpose visual recognition across modalities with limited supervision

Автор: Learning with Limited and Imperfect Data

Загружено: 2022-10-19

Просмотров: 881

Описание:

Abstract: Modern computer vision models are good at specialized tasks. Given the right architecture, right supervision, supervised learning can yield great specialist models. However, specialist models also have severe limitations — they can only do what they are trained for and require copious amounts of pristine supervision for it. In this talk, I’ll focus on two limitations: specialist models cannot work on tasks beyond what they saw training labels for, or on new types of visual data. I’ll present our recent efforts that design better architectures, training paradigms and loss functions to address these issues.

Our first work, called Omnivore, presents a single model that can operate on images, videos, and single-view 3D data. Omnivore leads to shared representations across visual modalities, without using paired input data. Omnivore can also be trained in a self-supervised manner. I’ll conclude the talk with Detic, a simple way to train large-vocabulary detectors using image-level labs which leads to a 20,000+ class detector.

Bio: Ishan Misra is a Research Scientist at FAIR, Meta AI where he works on computer vision. His interests are primarily in learning visual representations with limited supervision - using self-supervised, and weakly supervised learning. For his work in self-supervised learning, Ishan was features in MIT Tech Review’s list of 35 innovators under 35 compiled globally across all areas of technology. You can hear about his work at length on Lex Fridman’s podcast.

Ishan Misra: General purpose visual recognition across modalities with limited supervision

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Sharon Li: How to Handle Data Shifts? Challenges, Research Progress and Path Forward

Sharon Li: How to Handle Data Shifts? Challenges, Research Progress and Path Forward

Ishan Misra: Self-Supervised Deep Learning in Computer Vision | Lex Fridman Podcast #206

Ishan Misra: Self-Supervised Deep Learning in Computer Vision | Lex Fridman Podcast #206

Ishan Misra, Research Scientist at Facebook AI Research

Ishan Misra, Research Scientist at Facebook AI Research

Путин избавился от генерала / Арест и расстрел

Путин избавился от генерала / Арест и расстрел

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Удар по Су-27 в Крыму, Переговоры в Майами, Клинтон в файлах Эпштейна. Фейгин, Левиев,Давлетгильдеев

Удар по Су-27 в Крыму, Переговоры в Майами, Клинтон в файлах Эпштейна. Фейгин, Левиев,Давлетгильдеев

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Визуализация скрытого пространства: PCA, t-SNE, UMAP | Глубокое обучение с анимацией

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Vadim Sushko: One-Shot Synthesis of Images and Segmentation Masks

Vadim Sushko: One-Shot Synthesis of Images and Segmentation Masks

Holger Caesar: Autonomous vehicles from imperfect and limited labels

Holger Caesar: Autonomous vehicles from imperfect and limited labels

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

RAG простыми словами: как научить LLM работать с файлами

RAG простыми словами: как научить LLM работать с файлами

Bharath Hariharan: When life gives you lemons: Making lemonade from limited labels

Bharath Hariharan: When life gives you lemons: Making lemonade from limited labels

Чат ПГТ 5.2 - это похоронная. Самый УЖАСНЫЙ релиз в истории ИИ

Чат ПГТ 5.2 - это похоронная. Самый УЖАСНЫЙ релиз в истории ИИ

The unique phenomenon of

The unique phenomenon of "XD" in Poland

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Sukmin Yun: OpenCoS: Contrastive Semi-supervised Learning for Handling Open-set Unlabeled Data

Sukmin Yun: OpenCoS: Contrastive Semi-supervised Learning for Handling Open-set Unlabeled Data

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]