🤖Dev and doc👨🏻⚕️ introduces large multimodal models. ✨ The potential of LMMs combining image and text seem limitless, but what's the catch?
Dev and Doc is a Podcast where developers and doctors join forces to deep dive into AI in healthcare. Together, we can build models that matter.
👨🏻⚕️Doc - Dr. Joshua Au Yeung - / dr-joshua-auyeung
🤖Dev - Zeljko Kraljevic / zeljkokr
Hey! If you are enjoying our conversations, reach out, share your thoughts and journey with us. Don't forget to subscribe whilst you're here :)
00:00 start
00:32 intro
02:20 what is multimodality? And what are the potentials?
07:23 Large multimodal models paper deep dive (radiology)
16:23 paper deep dive 2 (pathology)
18:20 large multimodal models technical overview, exploration of other LMMs
29:20 Foundational models explanation
32:58 the model transparency index
34:00 Google PaLI-3, light weight models vs large Foundational models
40:44 Summary
41:55 the problems and work to be done for LMMs - hallucinations, inconsistencies, biases, security
47:00 A call for better evidence generation and trials with LMMs
50:40 final points - improving visual spatial recognition, thoughts for future
The podcast 🎙️
🔊Spotify: https://open.spotify.com/show/3QO5Lr3...
📙Substack: https://aiforhealthcare.substack.com/
🎞️ Editor-
Dragan Kraljević / dragan_kraljevic
🎨Brand design and art direction -
Ana Grigorovici
https://www.behance.net/anagrigorovic...
Поделиться в:
Доступные форматы для скачивания:
Скачать видео mp4
Информация по загрузке:
Скачать аудио mp3
Похожие видео
array(20) {
["lyRr_Fhytfc"]=>
object(stdClass)#8374 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "lyRr_Fhytfc"
["related_video_title"]=>
string(62) "The Age of AI agents in healthcare (Live Podcast at HETT 2025)"
["posted_time"]=>
string(25) "3 недели назад"
["channelName"]=>
NULL
}
["fjODJGOZ2TQ"]=>
object(stdClass)#8384 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "fjODJGOZ2TQ"
["related_video_title"]=>
string(74) "Everything you need to know about LLM benchmarks. (and why they're flawed)"
["posted_time"]=>
string(25) "2 месяца назад"
["channelName"]=>
NULL
}
["wjZofJX0v4M"]=>
object(stdClass)#8372 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "wjZofJX0v4M"
["related_video_title"]=>
string(148) "LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["d5ZMVIgQ0jM"]=>
object(stdClass)#8378 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "d5ZMVIgQ0jM"
["related_video_title"]=>
string(42) "Explaining Explainable AI (for healthcare)"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["AFe0D9q4JG4"]=>
object(stdClass)#8366 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "AFe0D9q4JG4"
["related_video_title"]=>
string(85) "Как лопнет пузырь Nvidia и нейросетей и что будет?"
["posted_time"]=>
string(22) "10 дней назад"
["channelName"]=>
NULL
}
["VVfFf_XW8zw"]=>
object(stdClass)#8379 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "VVfFf_XW8zw"
["related_video_title"]=>
string(83) "Как работает ChatGPT: объясняем нейросети просто"
["posted_time"]=>
string(21) "2 года назад"
["channelName"]=>
NULL
}
["OrZcBbUkyU0"]=>
object(stdClass)#8370 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "OrZcBbUkyU0"
["related_video_title"]=>
string(151) "Демис Хассабис из Google DeepMind: лекарство от рака, личные виртуальные миры и сильный ИИ"
["posted_time"]=>
string(25) "2 недели назад"
["channelName"]=>
NULL
}
["-8zrQggsVJU"]=>
object(stdClass)#8383 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "-8zrQggsVJU"
["related_video_title"]=>
string(180) "«Я понял, что это конец»: как создатель «Алисы» уволился из «Сбера», эмигрировал и строит AI-стартап"
["posted_time"]=>
string(25) "2 недели назад"
["channelName"]=>
NULL
}
["aircAruvnKk"]=>
object(stdClass)#8360 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "aircAruvnKk"
["related_video_title"]=>
string(101) "Но что такое нейронная сеть? | Глава 1. Глубокое обучение"
["posted_time"]=>
string(19) "8 лет назад"
["channelName"]=>
NULL
}
["WdbgNC80PMw"]=>
object(stdClass)#8385 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "WdbgNC80PMw"
["related_video_title"]=>
string(75) "ChatGPT Atlas and the next era of web browsing — the OpenAI Podcast Ep. 9"
["posted_time"]=>
string(23) "5 часов назад"
["channelName"]=>
NULL
}
["TprZ-83fAiE"]=>
object(stdClass)#8373 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "TprZ-83fAiE"
["related_video_title"]=>
string(150) "Нейробиолог: Как не отупеть к 50 годам. Связь слабоумия и привычек | Владимир Алипов"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["azccKy878G4"]=>
object(stdClass)#8377 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "azccKy878G4"
["related_video_title"]=>
string(42) "Exploring Claude Sonnet 3.7 for healthcare"
["posted_time"]=>
string(27) "8 месяцев назад"
["channelName"]=>
NULL
}
["vm8ZSrmlyZ0"]=>
object(stdClass)#8367 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "vm8ZSrmlyZ0"
["related_video_title"]=>
string(86) "How to build a clinically safe Large Language Model - Hippocratic AI, Llama3, Biollama"
["posted_time"]=>
string(19) "1 год назад"
["channelName"]=>
NULL
}
["1ESP9pdYi94"]=>
object(stdClass)#8365 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "1ESP9pdYi94"
["related_video_title"]=>
string(93) "Конференция «Алиса, что нового?» | 28 октября 2025 года"
["posted_time"]=>
string(25) "2 недели назад"
["channelName"]=>
NULL
}
["_6R7Ym6Vy_I"]=>
object(stdClass)#8363 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "_6R7Ym6Vy_I"
["related_video_title"]=>
string(149) "Что такое генеративный ИИ и как он работает? – Лекции Тьюринга с Миреллой Лапатой"
["posted_time"]=>
string(21) "2 года назад"
["channelName"]=>
NULL
}
["sn3od2MehJA"]=>
object(stdClass)#8364 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "sn3od2MehJA"
["related_video_title"]=>
string(89) "Testing Deepseek R1 on Complex Medical Tasks. Here's what we found. (DPO, GRPO explainer)"
["posted_time"]=>
string(27) "9 месяцев назад"
["channelName"]=>
NULL
}
["_ZvnD73m40o"]=>
object(stdClass)#8361 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "_ZvnD73m40o"
["related_video_title"]=>
string(64) "Prompt Engineering Tutorial – Master ChatGPT and LLM Responses"
["posted_time"]=>
string(21) "2 года назад"
["channelName"]=>
NULL
}
["GIQ1m2yXNI4"]=>
object(stdClass)#8362 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "GIQ1m2yXNI4"
["related_video_title"]=>
string(143) "Как Зеленский попал в крупнейший коррупционный скандал своего президентства?"
["posted_time"]=>
string(24) "11 часов назад"
["channelName"]=>
NULL
}
["LPZh9BOjkQs"]=>
object(stdClass)#8350 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "LPZh9BOjkQs"
["related_video_title"]=>
string(82) "Краткое объяснение больших языковых моделей"
["posted_time"]=>
string(28) "11 месяцев назад"
["channelName"]=>
NULL
}
["vdxCbup-dpM"]=>
object(stdClass)#8351 (5) {
["video_id"]=>
int(9999999)
["related_video_id"]=>
string(11) "vdxCbup-dpM"
["related_video_title"]=>
string(0) ""
["posted_time"]=>
string(27) "8 месяцев назад"
["channelName"]=>
NULL
}
}