Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

【2024/04/04】LLMアプリケーションの実験管理・評価の工夫を紹介〜PromptLayerを使った本番運用〜【アーカイブ】

Автор: StudyCo

Загружено: 2024-04-05

Просмотров: 689

Описание:

発表者Twitter:  / ueeeeniki   (ぜひフォローお願いします!)
===

LLMアプリケーションの開発が行われるようになり、本番運用している企業も増えてきました。 よいLLMアプリケーションを作るための工夫としてのプロンプトエンジニアリングやRAGなどの手法は、エンジニア界隈では広く一般に知られるようになってきました。

一方、LLMの実験管理や評価の方法についてはまだベストプラクティスが出揃っておらず、各社が手探りで行っているような状態です。評価ができなれば、どれだけLLMアプリケーションの精度改善のプラクティスが出ても、継続的に精度改善していくことはできません。 また、本番運用されるLLMアプリケーションは、精度やビジネスインパクトへの評価だけではなく、コストやレイテンシーを継続的にモニタリングしていくことも重要です。

発表者が所属するPharmaX社でも例に漏れず、手探りで評価方法を確立しようと奮闘しています。本発表では、発表者が得た知見や工夫を整理して発表したいと思います。

※本イベントは発表者の上野 が自社にて行ったイベント『LLMアプリケーションの実験管理・評価についての知見をまとめてみた』の内容と7割程度被ります

こちらの記事もご参考にしてください
・『LLMアプリケーションの実験管理の運用をまとめてみた〜PromptLayerを使った本番運用〜』
(https://zenn.dev/pharmax/articles/d31...)
・『LLMアプリケーションの評価の運用についてまとめてみた』(https://zenn.dev/pharmax/articles/48e...)

===

00:00 はじめに
03:44 LLMアプリケーションの実験管理・評価の工夫を紹介〜PromptLayerを使った本番運用〜
1:13:41 告知
1:16:00 質疑

===

2024/04/04に開催したオンラインセミナーのアーカイブ動画です。

イベントページ:https://studyco.connpass.com/event/31...

===

運営:https://studyco.io

【2024/04/04】LLMアプリケーションの実験管理・評価の工夫を紹介〜PromptLayerを使った本番運用〜【アーカイブ】

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用

Cursor AgentによるパーソナルAIアシスタント育成入門―業務のプロンプト化・MCPの活用

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

【2024/10/30】LLMアプリケーションのトレース・評価と継続的改善〜LangSmithを使ったLLMOps構築〜【アーカイブ】

【2024/10/30】LLMアプリケーションのトレース・評価と継続的改善〜LangSmithを使ったLLMOps構築〜【アーカイブ】

RAG | ВСЁ, что тебе нужно знать (+ 11 Продвинутых стратегий)

RAG | ВСЁ, что тебе нужно знать (+ 11 Продвинутых стратегий)

【SmartHRの事例紹介!】働きがいある組織の作り方

【SmartHRの事例紹介!】働きがいある組織の作り方

Это вредоносное ПО? — Получение root-прав на SuperBox S6 Pro

Это вредоносное ПО? — Получение root-прав на SuperBox S6 Pro

開発AIツール比較座談会!Copilot・Cursor・Cline・Devin・Windsurf

開発AIツール比較座談会!Copilot・Cursor・Cline・Devin・Windsurf

Упадок российской экономики. Россияне «не заметят» роста цен. Экономика за 1001 секунду

Упадок российской экономики. Россияне «не заметят» роста цен. Экономика за 1001 секунду

Я ЗАМЕНИЛ N8N на ЭТО и не жалею | Альтернатива для профи

Я ЗАМЕНИЛ N8N на ЭТО и не жалею | Альтернатива для профи

Денег на всё не хватит... Вклады уже в опасности? || Дмитрий Потапенко* и Дмитрий Дёмушкин

Денег на всё не хватит... Вклады уже в опасности? || Дмитрий Потапенко* и Дмитрий Дёмушкин

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Как производятся микрочипы? 🖥️🛠️ Этапы производства процессоров

Обзор Neuralink, осень 2025 г.

Обзор Neuralink, осень 2025 г.

Вы еще не используете NotebookLM?

Вы еще не используете NotebookLM?

Я заставил Клода писать код 24 часа без остановки. Вот что из этого вышло

Я заставил Клода писать код 24 часа без остановки. Вот что из этого вышло

結局みんなどうAI使ってるの?リアルなAIツール活用法雑談会

結局みんなどうAI使ってるの?リアルなAIツール活用法雑談会

Перестаньте изучать n8n в 2025 году... Лучше изучите ЭТО

Перестаньте изучать n8n в 2025 году... Лучше изучите ЭТО

Программируем с Google Antigravity + Gemini 3 Pro. СМОЖЕТ КАЖДЫЙ!

Программируем с Google Antigravity + Gemini 3 Pro. СМОЖЕТ КАЖДЫЙ!

Результат меня ШОКИРОВАЛ! Тестируем конкурента Suno и Udio!

Результат меня ШОКИРОВАЛ! Тестируем конкурента Suno и Udio!

Кейтлин Лесс – Развитие API Клода для агентов, антропогенных

Кейтлин Лесс – Развитие API Клода для агентов, антропогенных

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]