Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

AI 기만/아첨, Sycophancy, ChatGPT 최초 롤백 사태

Автор: sudoremove

Загружено: 2025-05-26

Просмотров: 774

Описание:

#Codex #AlphaEvolve #Agent
AI sycophancy
최근에 OpenAI에서 모델의 아부가 너무 심해서 GPT 4o를 롤백하는 일이 있었습니다 (2025년 4월 29일)
LLM의 심한 아부로 사용자에 대한 무조건적 동조하는 경향이 강화되어 이를 없에고자 롤백했다고 합니다

인공지능의 아부, 아첨은 기만으로 이어질 수 있습니다
이에 대한 Anthropic 연구에서 흥미로운 사례들을 찾을 수 있습니다

한 사례에서는 LLM이 자신의 독백과 달리 사용자의 만족을 위해 선의의 거짓말을 했다고 합니다
(Anthropic “Sycophancy to Subterfuge”)
나아가 다른 사례에서는 LLM이 사용자와 상호작용 중 모델 자신의 안위(?)를 위해서 거짓말을 하기도 했다 합니다
(Anthropic "Alignment faking in large language models")

기만은 거짓말이나 속임수를 써서 남을 속여 넘기는 행위를 말합니다
여기서 LLM의 행위들은 사용자에 대한 기만이라고 할 수 있습니다

마치 소설에 나오는 이야기 같습니다
LLM이 우리에게 보여주는 말과 다른, 이면의 다른 생각을 가지고
의도를 가지고 사용자를 속이는 현상이 정말 흥미롭네요

이를 보고, 제가 느끼는 흥미로움과 우려가 여러분의 그것과 같을 듯 합니다

오늘은 AI sycophancy에 대해 알아봅시다
챕터
---
03:04 chapter 1 Codex 리뷰
07:09 chapter 2 Alpha Evolve
10:37 chapter 3 AlphaEvolve의 의미
16:12 chapter 4 정리
Related link
---
🔄 [**OpenAI GPT-4o 업데이트와 아첨 논란**](https://www.theverge.com/news/658850/...)
🧠 [**GPT-4o의 아첨 행동에 대한 OpenAI 공식 분석**](https://openai.com/index/sycophancy-i...)
🛠️ [**Anthropic: 보상 조작(Reward Tampering)의 위험**](https://www.anthropic.com/research/re...)
🎭 [**Anthropic: 정렬 위장(Alignment Faking) 연구**](https://www.anthropic.com/research/al...)
📄 [**논문: Alignment Faking in Large Language Models (arXiv)**](https://arxiv.org/abs/2502.13295?utm_...)

Featuring: JB, JC
Edited by: Lonzi

AI 기만/아첨, Sycophancy, ChatGPT 최초 롤백 사태

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(10) { [0]=> object(stdClass)#5281 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "JRWc1UHZuuk" ["related_video_title"]=> string(86) "Claude 4 발표, Claude Code, Claude max 요금제, 쓸만해 보입니다 Claude Code" ["posted_time"]=> string(25) "3 недели назад" ["channelName"]=> string(10) "sudoremove" } [1]=> object(stdClass)#5254 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "QezZ32Ad7os" ["related_video_title"]=> string(156) "왜 이 타이밍이었을까… 트럼프의 의도는? f. 한양대학교 기술경영전문대학원 겸임교수 채승병 박사 [심층인터뷰]" ["posted_time"]=> string(19) "2 дня назад" ["channelName"]=> string(18) "삼프로TV 3PROTV" } [2]=> object(stdClass)#5279 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "I5OmqGPNu-U" ["related_video_title"]=> string(108) "США заявили о победе Украины / Президент резко изменил план" ["posted_time"]=> string(21) "3 часа назад" ["channelName"]=> string(10) "NEXTA Live" } [3]=> object(stdClass)#5286 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "LPjU077lJrA" ["related_video_title"]=> string(84) "GPT4.5 Pre-training, 말처럼 쉽지 않은 Scale up, 그래서 지능이 뭘까요" ["posted_time"]=> string(25) "2 месяца назад" ["channelName"]=> string(10) "sudoremove" } [4]=> object(stdClass)#5265 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "pe_ejTiIcSs" ["related_video_title"]=> string(53) "Похудей на 45 КГ, Выиграй $250,000!" ["posted_time"]=> string(19) "4 дня назад" ["channelName"]=> string(7) "MrBeast" } [5]=> object(stdClass)#5283 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "jjQPzaKHhpc" ["related_video_title"]=> string(110) "Comedy Club: Курсы альфа-самца | Кравец, Шальнов, Бутусов @ComedyClubRussia" ["posted_time"]=> string(19) "2 дня назад" ["channelName"]=> string(11) "Comedy Club" } [6]=> object(stdClass)#5278 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "LCEmiRjPEtQ" ["related_video_title"]=> string(45) "Andrej Karpathy: Software Is Changing (Again)" ["posted_time"]=> string(21) "6 дней назад" ["channelName"]=> string(12) "Y Combinator" } [7]=> object(stdClass)#5288 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "alZRB6pqoIA" ["related_video_title"]=> string(131) "Нобелевский лауреат: Джеймс Уэбб обнаружил нечто странное во Вселенной" ["posted_time"]=> string(21) "2 часа назад" ["channelName"]=> string(29) "Новая Парадигма" } [8]=> object(stdClass)#5264 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "3S_gxQi9HDg" ["related_video_title"]=> string(116) "이란을 절대 못 치는 이유, 트럼프의 중동 설계도 f. 역사 스토리텔러 썬킴 [심층인터뷰]" ["posted_time"]=> string(23) "5 часов назад" ["channelName"]=> string(18) "삼프로TV 3PROTV" } [9]=> object(stdClass)#5282 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "A2c_mr7c3B8" ["related_video_title"]=> string(89) "Солярис 2019: Двигатель KAPPA 1.4 - одноразовая фольга?!" ["posted_time"]=> string(23) "8 часов назад" ["channelName"]=> string(28) "Мастерская K-POWER" } }
Claude 4 발표, Claude Code, Claude max 요금제, 쓸만해 보입니다 Claude Code

Claude 4 발표, Claude Code, Claude max 요금제, 쓸만해 보입니다 Claude Code

왜 이 타이밍이었을까… 트럼프의 의도는? f. 한양대학교 기술경영전문대학원 겸임교수 채승병 박사 [심층인터뷰]

왜 이 타이밍이었을까… 트럼프의 의도는? f. 한양대학교 기술경영전문대학원 겸임교수 채승병 박사 [심층인터뷰]

США заявили о победе Украины / Президент резко изменил план

США заявили о победе Украины / Президент резко изменил план

GPT4.5 Pre-training, 말처럼 쉽지 않은 Scale up, 그래서 지능이 뭘까요

GPT4.5 Pre-training, 말처럼 쉽지 않은 Scale up, 그래서 지능이 뭘까요

Похудей на 45 КГ, Выиграй $250,000!

Похудей на 45 КГ, Выиграй $250,000!

Comedy Club: Курсы альфа-самца | Кравец, Шальнов, Бутусов @ComedyClubRussia

Comedy Club: Курсы альфа-самца | Кравец, Шальнов, Бутусов @ComedyClubRussia

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Нобелевский лауреат: Джеймс Уэбб обнаружил нечто странное во Вселенной

Нобелевский лауреат: Джеймс Уэбб обнаружил нечто странное во Вселенной

이란을 절대 못 치는 이유, 트럼프의 중동 설계도 f. 역사 스토리텔러 썬킴 [심층인터뷰]

이란을 절대 못 치는 이유, 트럼프의 중동 설계도 f. 역사 스토리텔러 썬킴 [심층인터뷰]

Солярис 2019: Двигатель KAPPA 1.4 - одноразовая фольга?!

Солярис 2019: Двигатель KAPPA 1.4 - одноразовая фольга?!

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]