10talks Upstage 독자 파운데이션 모델 컨소시엄 세미나(8회차)
Автор: Upstage
Загружено: 2026-01-22
Просмотров: 783
일시: 2026.01.23(금) 오전 11시 ~ 12시
연사: 이화란 교수(서강대학교 인공지능학과 및 컴퓨터공학과 조교수)
주제 : Safety Evaluation and Alignment in LLMs
강의자료 : 세미나 이후 전달 예정
세션 소개 : 이번 발표에서는 사회문화적 인식을 갖춘 다국어 대규모 언어 모델(LLM)을 위한 최신 평가 벤치마크를 소개합니다. 사회적 편향과 사회적 가치를 포함한 안전성 측면에서 SQuARe, KoSBi, KoBBQ의 벤치마크 구축 프레임워크를 간략히 제시하겠습니다. 이어서 다국어 LLM의 취약성과 레드티밍(red-teaming) 공격 방법, 그리고 효율적인 다국어 전이 방법론에 대해 논의합니다. 마지막으로 신뢰할 수 있고 안전한 AI 에이전트를 위한 향후 방향성을 제시합니다.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: