Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Aligning AI models for healthcare | Reinforcement Learning from Human Feedback (RLHF)

Автор: Dev and Doc: AI for Healthcare

Загружено: 2024-02-15

Просмотров: 326

Описание:

How do we align AI models for healthcare? 👨‍⚕️ And importantly, the moral codes and ethics that we practice everyday, how does the LLM deal with ethical scenarios like the trolley problem for example? This is a fascinating topic and one we spend a lot of time thinking about.

In this episode Dev and Doc, Zeljko Kraljevic and I cover all the up to date topics around reinforcement learning, the benefits and where it can go wrong. We also discuss different RL methods including the algorithms used to train ChatGPT (RLHF).

Dev and Doc is a Podcast where developers and doctors join forces to deep dive into AI in healthcare. Together, we can build models that matter.

👨🏻‍⚕️Doc - Dr. Joshua Au Yeung -   / dr-joshua-auyeung  
🤖Dev - Zeljko Kraljevic   / zeljkokr  

The podcast 🎙️
🔊Spotify: https://open.spotify.com/show/3QO5Lr3...
📙Substack: https://aiforhealthcare.substack.com/

Hey! If you are enjoying our conversations, reach out, share your thoughts and journey with us. Don't forget to subscribe whilst you're here :)

🎞️ Editor-
Dragan Kraljević   / dragan_kraljevic  

🎨Brand design and art direction -
Ana Grigorovici
https://www.behance.net/anagrigorovic...

00:00 Highlights
01:27 start
4:38 aligning ethics of ai models
7:04 doctors ethical choices daily
8:00 RLHF and AI training methods
16:29 reinforcement learning
19:35 Preference model -rewarding models correctly can make or break the success
27:05 exploiting reward function, model degradation (and how to fix it)

Ref
AI intro paper - https://pn.bmj.com/content/23/6/476
Open AI RLHF paper - https://arxiv.org/abs/1909.08593
War and peace of LLMs! - https://arxiv.org/abs/2311.17227

Aligning AI models for healthcare | Reinforcement Learning from Human Feedback (RLHF)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(20) { ["h9JlvR42njc"]=> object(stdClass)#7614 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "h9JlvR42njc" ["related_video_title"]=> string(31) "The death of Prompt Engineering" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["sn3od2MehJA"]=> object(stdClass)#7621 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "sn3od2MehJA" ["related_video_title"]=> string(89) "Testing Deepseek R1 on Complex Medical Tasks. Here's what we found. (DPO, GRPO explainer)" ["posted_time"]=> string(27) "9 месяцев назад" ["channelName"]=> NULL } ["Sm411BJ_jjk"]=> object(stdClass)#7612 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "Sm411BJ_jjk" ["related_video_title"]=> string(93) "Python openpyxl library for adding different types of charts and to add image to Excel file." ["posted_time"]=> string(65) "Трансляция закончилась 1 день назад" ["channelName"]=> NULL } ["A7k088NtfDc"]=> object(stdClass)#7617 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "A7k088NtfDc" ["related_video_title"]=> string(113) "США объявили о начале спецоперации / Военные начали вторжение" ["posted_time"]=> string(23) "5 часов назад" ["channelName"]=> NULL } ["PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi"]=> object(stdClass)#7606 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(34) "PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi" ["related_video_title"]=> string(15) "Neural networks" ["posted_time"]=> string(0) "" ["channelName"]=> NULL } ["ILpzf8Od8xA"]=> object(stdClass)#7623 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "ILpzf8Od8xA" ["related_video_title"]=> string(24) "Why you should do a PhD!" ["posted_time"]=> string(25) "4 месяца назад" ["channelName"]=> NULL } ["6NK4Pona2fY"]=> object(stdClass)#7610 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "6NK4Pona2fY" ["related_video_title"]=> string(102) "Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)" ["posted_time"]=> string(25) "4 недели назад" ["channelName"]=> NULL } ["vdxCbup-dpM"]=> object(stdClass)#7618 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "vdxCbup-dpM" ["related_video_title"]=> string(76) "Is it still worth doing a PhD in 2025? (Computer Science / Machine Learning)" ["posted_time"]=> string(27) "8 месяцев назад" ["channelName"]=> NULL } ["wp7izqZmiWM"]=> object(stdClass)#7600 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "wp7izqZmiWM" ["related_video_title"]=> string(130) "«Open AI — это пузырь»! Откровения из Кремниевой долины | Братья Либерманы" ["posted_time"]=> string(25) "2 недели назад" ["channelName"]=> NULL } ["_doSjv_z9xI"]=> object(stdClass)#7625 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "_doSjv_z9xI" ["related_video_title"]=> string(131) "«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме" ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } ["lyRr_Fhytfc"]=> object(stdClass)#7613 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "lyRr_Fhytfc" ["related_video_title"]=> string(62) "The Age of AI agents in healthcare (Live Podcast at HETT 2025)" ["posted_time"]=> string(25) "3 недели назад" ["channelName"]=> NULL } ["umbtgR77mR8"]=> object(stdClass)#7624 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "umbtgR77mR8" ["related_video_title"]=> string(122) "70 млн в России, мигранты, Китай: что происходит с населением? / вДудь" ["posted_time"]=> string(21) "9 дней назад" ["channelName"]=> NULL } ["n4NokjyAklg"]=> object(stdClass)#7607 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "n4NokjyAklg" ["related_video_title"]=> string(128) "Какая степень магистра права лучше всего подойдет для ВАШЕГО проекта?" ["posted_time"]=> string(19) "2 дня назад" ["channelName"]=> NULL } ["nLUG97wvQj0"]=> object(stdClass)#7605 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "nLUG97wvQj0" ["related_video_title"]=> string(176) "ГРЕБЕНЩИКОВ: "Проснитесь!". Чего стеснялся Цой, что с Шевчуком, Сплин, Борзыкин, "Этот поезд в огне"" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["dX9CGRZwD-w"]=> object(stdClass)#7603 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "dX9CGRZwD-w" ["related_video_title"]=> string(125) "Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров" ["posted_time"]=> string(19) "1 год назад" ["channelName"]=> NULL } ["nNh4rJR-1DM"]=> object(stdClass)#7604 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "nNh4rJR-1DM" ["related_video_title"]=> string(123) "AI-стартап за 38 часов: вайб-кодинг спидран с Claude Code (идея → MVP → релиз)" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } ["huoOKAu_5KQ"]=> object(stdClass)#7601 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "huoOKAu_5KQ" ["related_video_title"]=> string(158) "Мо Гавдат (екс директор Google X) об изменениях в сфере ИИ, власти и обществе в будущем и др." ["posted_time"]=> string(21) "1 день назад" ["channelName"]=> NULL } ["Ix-eu5aqYkQ"]=> object(stdClass)#7602 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "Ix-eu5aqYkQ" ["related_video_title"]=> string(131) "Коалиция ИИ: Джефф Хинтон, Янн Лекун, Ли Фей-Фей и другие делятся мыслями" ["posted_time"]=> string(21) "5 дней назад" ["channelName"]=> NULL } ["Q_9KNz7nnlA"]=> object(stdClass)#7590 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "Q_9KNz7nnlA" ["related_video_title"]=> string(180) "Что произойдёт, когда появится цифровой суперинтеллект? Доктор Фэй-Фэй Ли и доктор Эрик Шмидт на ..." ["posted_time"]=> string(25) "2 недели назад" ["channelName"]=> NULL } ["05bMbz8M944"]=> object(stdClass)#7591 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "05bMbz8M944" ["related_video_title"]=> string(0) "" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> NULL } }
The death of Prompt Engineering

The death of Prompt Engineering

Testing Deepseek R1 on Complex Medical Tasks. Here's what we found. (DPO, GRPO explainer)

Testing Deepseek R1 on Complex Medical Tasks. Here's what we found. (DPO, GRPO explainer)

Python openpyxl library for  adding different types of charts and to add image to Excel file.

Python openpyxl library for adding different types of charts and to add image to Excel file.

США объявили о начале спецоперации / Военные начали вторжение

США объявили о начале спецоперации / Военные начали вторжение

Neural networks

Neural networks

Why you should do a PhD!

Why you should do a PhD!

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Is it still worth doing a PhD in 2025? (Computer Science / Machine Learning)

Is it still worth doing a PhD in 2025? (Computer Science / Machine Learning)

«Open AI — это пузырь»! Откровения из Кремниевой долины | Братья Либерманы

«Open AI — это пузырь»! Откровения из Кремниевой долины | Братья Либерманы

«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме

«Очень не люблю двуличие» — Наталья Зубаревич об экономике и фатализме

The Age of AI agents in healthcare (Live Podcast at HETT 2025)

The Age of AI agents in healthcare (Live Podcast at HETT 2025)

70 млн в России, мигранты, Китай: что происходит с населением? / вДудь

70 млн в России, мигранты, Китай: что происходит с населением? / вДудь

Какая степень магистра права лучше всего подойдет для ВАШЕГО проекта?

Какая степень магистра права лучше всего подойдет для ВАШЕГО проекта?

ГРЕБЕНЩИКОВ:

ГРЕБЕНЩИКОВ: "Проснитесь!". Чего стеснялся Цой, что с Шевчуком, Сплин, Борзыкин, "Этот поезд в огне"

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

AI-стартап за 38 часов: вайб-кодинг спидран с Claude Code (идея → MVP → релиз)

AI-стартап за 38 часов: вайб-кодинг спидран с Claude Code (идея → MVP → релиз)

Мо Гавдат (екс директор Google X) об изменениях в сфере ИИ, власти и обществе в будущем и др.

Мо Гавдат (екс директор Google X) об изменениях в сфере ИИ, власти и обществе в будущем и др.

Коалиция ИИ: Джефф Хинтон, Янн Лекун, Ли Фей-Фей и другие делятся мыслями

Коалиция ИИ: Джефф Хинтон, Янн Лекун, Ли Фей-Фей и другие делятся мыслями

Что произойдёт, когда появится цифровой суперинтеллект? Доктор Фэй-Фэй Ли и доктор Эрик Шмидт на ...

Что произойдёт, когда появится цифровой суперинтеллект? Доктор Фэй-Фэй Ли и доктор Эрик Шмидт на ...

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]