Как инженеры ИИ улучшают агентные продукты

Автор: Adam Lucek

Загружено: 2025-12-09

Просмотров: 1651

Описание:

С Brilliant каждый может стать любителем математики и естественных наук! Зайдите на сайт https://brilliant.org/AdamLucek/, чтобы начать обучение и получить скидку 20% на годовую премиум-подписку.

Ресурсы:
Обсуждаемый контент - https://lucek.ai/blogs/llm-evaluations
Оценщик - https://github.com/ALucek/evaluizer
Часто задаваемые вопросы об оценке LLM - https://hamel.dev/blog/posts/evals-faq/
Краткие размышления о разработке ИИ и «проваленных проектах ИИ»
https://www.sh-reya.com/blog/ai-engin...
Оценка продукта в три простых шага - https://eugeneyan.com/writing/product...
Судья LLM не спасёт продукт — поможет исправление процесса
https://eugeneyan.com/writing/eval-pr...
Руководство по быстрому улучшению продуктов ИИ - https://hamel.dev/blog/posts/field-gu...
Кто проверяет валидатора - https://arxiv.org/pdf/2404.12272

Главы:
00:00 — Почему нам нужно совершенствоваться?
05:20 — Великолепно!
07:13 — Продолжение контекста
09:10 — Что такое оценки LLM?
12:11 — Обратная связь
13:48 — Создание начального набора обратной связи
16:15 — Аннотация, часть 1
19:56 — Анализ ошибок
26:14 — LLM-As-AJudge (магистр права как судья)
27:44 — Подводные камни для LLM-судьи
29:46 — Согласование LLM-судьи
33:11 — Оценка функций
36:10 — Платформы для наблюдения
39:09 — Преимущества
40:21 — Преимущество: алгоритмическая оптимизация
42:37 — Преимущество: обучение с подкреплением
44:28 — Контрольный список на будущее
47:10 — Стоит ли оно того?

Это видео спонсируется Brilliant

#ai #coding #datascience

Как инженеры ИИ улучшают агентные продукты

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Stop Prompt Engineering! Program Your LLMs with DSPy

Stop Prompt Engineering! Program Your LLMs with DSPy

How Does Retrieval Augmented Generation (RAG) Actually Work?

How Does Retrieval Augmented Generation (RAG) Actually Work?

Why Vector Databases Are Suddenly Everywhere (In Simple Terms)

Why Vector Databases Are Suddenly Everywhere (In Simple Terms)

Reinforcement Learning with Verifiable Rewards - Teaching LLMs to Solve Problems

Reinforcement Learning with Verifiable Rewards - Teaching LLMs to Solve Problems

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Fine Tuning Video Generation Models | Make Your Own AI Videos

Fine Tuning Video Generation Models | Make Your Own AI Videos

Большинство разработчиков не понимают, как работают контекстные окна.

Большинство разработчиков не понимают, как работают контекстные окна.

Создайте агентов ИИ, которые работают, пока вы спите | Deep Agents

Создайте агентов ИИ, которые работают, пока вы спите | Deep Agents

But what is quantum computing? (Grover's Algorithm)

But what is quantum computing? (Grover's Algorithm)

Do Reranking Models Actually Improve RAG?

Do Reranking Models Actually Improve RAG?

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Как я создал ИИ-сотрудника с помощью Deep Agents

Как я создал ИИ-сотрудника с помощью Deep Agents

The Day Feynman Realized Students Knew NOTHING (Brazil Lecture, 1952)

The Day Feynman Realized Students Knew NOTHING (Brazil Lecture, 1952)

Вы (пока) не отстаёте: как освоить ИИ за 17 минут

Вы (пока) не отстаёте: как освоить ИИ за 17 минут

Как я учусь в 10 раз быстрее: Система с AI, Perplexity и NotebookLM

Как я учусь в 10 раз быстрее: Система с AI, Perplexity и NotebookLM

Why Every AI Developer Should Learn Model Context Protocol (MCP)

Why Every AI Developer Should Learn Model Context Protocol (MCP)

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

ЛУЧШАЯ БЕСПЛАТНАЯ НЕЙРОСЕТЬ Google, которой нет аналогов

Почему мы верим телефонным мошенникам? — Семихатов, Ениколопов

Почему мы верим телефонным мошенникам? — Семихатов, Ениколопов

I Trained an LLM to Think Deeper (Here's How)

I Trained an LLM to Think Deeper (Here's How)