Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

LEXam: Сравнительный анализ навыков юридического мышления на 340 экзаменах по праву.

Автор: Law and Technology Centre, HKU

Загружено: 2025-12-09

Просмотров: 91

Описание:

Дата: 8 декабря 2025 г. (понедельник)
Время: 17:00 – 18:00
Место проведения: Комната 723, 7-й этаж, башня Ченг Ю Тун, Гонконгский университет

Докладчик: Ю Фан (аспирант, Центр права и экономики, ETH Zurich)

Развернутое юридическое рассуждение остается ключевой проблемой для больших языковых моделей (LLM), несмотря на недавние достижения в масштабировании времени тестирования. Мы представляем LEXam, новый эталонный набор данных, полученный на основе 340 экзаменов по праву, охватывающих 116 курсов юридических факультетов по различным предметам и уровням образования. Набор данных включает 4886 экзаменационных вопросов по праву на английском и немецком языках, в том числе 2841 развернутый вопрос открытого типа и 2045 вопросов с множественным выбором. Помимо эталонных ответов, открытые вопросы также сопровождаются подробными указаниями, описывающими ожидаемый подход к юридическому рассуждению, такой как выявление проблем, запоминание правил или применение правил. Наша оценка как открытых вопросов, так и вопросов с множественным выбором представляет собой значительные трудности для современных моделей юридического анализа; в частности, они испытывают проблемы с открытыми вопросами, требующими структурированного, многоэтапного юридического рассуждения. Более того, наши результаты подчеркивают эффективность набора данных в различении моделей с различными возможностями. Применяя парадигму «юридический аналитик как судья» с тщательной проверкой экспертами, мы демонстрируем, как шаги рассуждения, сгенерированные моделью, могут быть оценены последовательно и точно. Наша схема оценки предоставляет масштабируемый метод оценки качества юридического рассуждения, выходящий за рамки простых показателей точности.

Ю Фан — аспирант Центра права и экономики в ETH Zurich и ассоциированный исследователь в Центре искусственного интеллекта ETH. Его научный руководитель — профессор Эллиот Эш, а соруководитель — профессор Мринмая Сачан. До прихода в Центр он работал научным сотрудником в D-MTEC, ETH Zurich. В сферу его научных интересов входят обработка естественного языка, юридическая обработка естественного языка и вычислительные социальные науки, а текущие проекты сосредоточены на юридическом мышлении и поиске информации.

Модератор: Бенджамин Чен, доцент и директор Центра права и технологий, юридический факультет Гонконгского университета.

LEXam: Сравнительный анализ навыков юридического мышления на 340 экзаменах по праву.

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Торг с алгоритмами

Торг с алгоритмами

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

Stanford CS25: V5 I Large Language Model Reasoning, Denny Zhou of Google Deepmind

Regulating for AI Legitimacy

Regulating for AI Legitimacy

ЭТИ законы изменят ВСЕ! / Что ждет КАЖДОГО уже с 1 января 2026?

ЭТИ законы изменят ВСЕ! / Что ждет КАЖДОГО уже с 1 января 2026?

Facility Location Explained | How Companies Choose Where to Operate

Facility Location Explained | How Companies Choose Where to Operate

Alva Labs Logic Test Solved! (10 Questions Intermediate - Advanced)

Alva Labs Logic Test Solved! (10 Questions Intermediate - Advanced)

An Assessment of China’s Social Credit System (SCS) Using Interview Evidence from Shanghai

An Assessment of China’s Social Credit System (SCS) Using Interview Evidence from Shanghai

Год отключений и блокировок: что осталось от интернета в России?

Год отключений и блокировок: что осталось от интернета в России?

Мухаммед Али против Ивана Драго! Этот Бой не Забыть...

Мухаммед Али против Ивана Драго! Этот Бой не Забыть...

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Automated Private Enforcement: Evidence from the Google Fonts Case

Automated Private Enforcement: Evidence from the Google Fonts Case

Arman Cohan - Evaluating and Understanding LLMs: From Scientific Reasoning to Alignment as Judges

Arman Cohan - Evaluating and Understanding LLMs: From Scientific Reasoning to Alignment as Judges

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Как освоить LR | Логическое мышление LSAT

Как освоить LR | Логическое мышление LSAT

CIIR Talk Series-12/5/2025: F. M. Nardini - Efficient Indexing & Retrieval with Learned Sparse Reps

CIIR Talk Series-12/5/2025: F. M. Nardini - Efficient Indexing & Retrieval with Learned Sparse Reps

NotebookLM: Таблицы из всего. 4 Способа применения

NotebookLM: Таблицы из всего. 4 Способа применения

ХОДОРКОВСКИЙ: Война скоро закончится. Россия не встанет с дивана. Путин и риски. Что с оппозицией

ХОДОРКОВСКИЙ: Война скоро закончится. Россия не встанет с дивана. Путин и риски. Что с оппозицией

Если Вам Задают Эти 5 Вопросов — Вами Пытаются Манипулировать - Карл Юнг

Если Вам Задают Эти 5 Вопросов — Вами Пытаются Манипулировать - Карл Юнг

Уроки с передовой: создание оценочных программ LLM, которые работают в реальной жизни: Апарна Дхи...

Уроки с передовой: создание оценочных программ LLM, которые работают в реальной жизни: Апарна Дхи...

Debates in Private Law: Should the law recognise property rights in digital files?

Debates in Private Law: Should the law recognise property rights in digital files?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]