How to nitpick multimodal AI evaluations (CVPR 2025 Tutorial Excerpt)

Автор: Michael Saxon (NLP & Generative AI research)

Загружено: 2025-06-11

Просмотров: 68

Описание:

My part of the 2025 CVPR tutorial, "Evaluating Large Multi-modal Models: Challenges and Methods"
https://lmm-understand.github.io/

Papers covered:

1. Aditya Sharma*, Michael Saxon*, William Yang Wang, " Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts", findings of EMNLP 2024
https://aclanthology.org/2024.finding...

2. Michael Saxon*, Fatima Jahara*, Mahsa Khoshnoodi*, Yujie Lu, Aditya Sharma, William Yang Wang. " Who Evaluates the Evaluations? Objectively Scoring Text-to-Image Prompt Coherence Metrics with T2IScoreScore (TS2)," NeurIPS 2024 Spotlight
https://openreview.net/forum?id=S4YRC...

How to nitpick multimodal AI evaluations (CVPR 2025 Tutorial Excerpt)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(10) { [0]=> object(stdClass)#4551 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "aircAruvnKk" ["related_video_title"]=> string(101) "Но что такое нейронная сеть? | Глава 1. Глубокое обучение" ["posted_time"]=> string(19) "7 лет назад" ["channelName"]=> string(11) "3Blue1Brown" } [1]=> object(stdClass)#4524 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "s86twdSCd7I" ["related_video_title"]=> string(96) "Translation errors make it hard to assess multilinguality in diffusion models! [NAACL 2024 talk]" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> string(44) "Michael Saxon (NLP & Generative AI research)" } [2]=> object(stdClass)#4549 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "wjZofJX0v4M" ["related_video_title"]=> string(148) "LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> string(11) "3Blue1Brown" } [3]=> object(stdClass)#4556 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "tBYJFLaM71U" ["related_video_title"]=> string(90) "Disparities in Text-to-Image Model Conceptual Knowledge Across Languages [FAccT 2023 Talk]" ["posted_time"]=> string(21) "2 года назад" ["channelName"]=> string(44) "Michael Saxon (NLP & Generative AI research)" } [4]=> object(stdClass)#4535 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "T7BKLTcowS4" ["related_video_title"]=> string(76) "Learning With AI: Cosmogogical Collaboration in the Human-AI-World Ecosystem" ["posted_time"]=> string(19) "4 дня назад" ["channelName"]=> string(13) "Julie Lindsay" } [5]=> object(stdClass)#4553 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "jM14cBDqQXA" ["related_video_title"]=> string(98) "Россия обстреляла Boeing / Массовая эвакуация из столицы" ["posted_time"]=> string(24) "11 часов назад" ["channelName"]=> string(10) "NEXTA Live" } [6]=> object(stdClass)#4548 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "aOm75o2Z5-o" ["related_video_title"]=> string(48) "Prompt Engineering 101 - Crash Course & Tips" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> string(10) "AssemblyAI" } [7]=> object(stdClass)#4558 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "q6jrIPT1_P8" ["related_video_title"]=> string(98) "Новая нейросеть пугает даже своих создателей | Claude opus" ["posted_time"]=> string(25) "2 недели назад" ["channelName"]=> string(8) "Web3nity" } [8]=> object(stdClass)#4534 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "TprZ-83fAiE" ["related_video_title"]=> string(150) "Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов" ["posted_time"]=> string(27) "8 месяцев назад" ["channelName"]=> string(46) "Подкаст Алексея Голубева" } [9]=> object(stdClass)#4552 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "etglXpiagq4" ["related_video_title"]=> string(100) "КОД БОГА Самая запрещённая лекция ПРОФЕССОРА ГАРЯЕВА" ["posted_time"]=> string(21) "3 года назад" ["channelName"]=> string(19) "Слава Рода" } }

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Translation errors make it hard to assess multilinguality in diffusion models! [NAACL 2024 talk]

Translation errors make it hard to assess multilinguality in diffusion models! [NAACL 2024 talk]

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Disparities in Text-to-Image Model Conceptual Knowledge Across Languages [FAccT 2023 Talk]

Disparities in Text-to-Image Model Conceptual Knowledge Across Languages [FAccT 2023 Talk]

Learning With AI: Cosmogogical Collaboration in the Human-AI-World Ecosystem

Learning With AI: Cosmogogical Collaboration in the Human-AI-World Ecosystem

Россия обстреляла Boeing / Массовая эвакуация из столицы

Россия обстреляла Boeing / Массовая эвакуация из столицы

Prompt Engineering 101 - Crash Course & Tips

Prompt Engineering 101 - Crash Course & Tips

Новая нейросеть пугает даже своих создателей | Claude opus

Новая нейросеть пугает даже своих создателей | Claude opus

Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов

Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов

КОД БОГА Самая запрещённая лекция ПРОФЕССОРА ГАРЯЕВА

КОД БОГА Самая запрещённая лекция ПРОФЕССОРА ГАРЯЕВА