Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Scaling AI: From Custom Speech Stacks to Evaluating Agents with LLMs

Автор: Fonzi AI Engineering Community

Загружено: 2026-01-20

Просмотров: 0

Описание:

In this technical deep dive, experts from Suki, Robinhood, and Databricks share first-hand insights on building and scaling modern AI systems. We cover the full lifecycle of AI development: from designing domain-specific speech stacks and foundational models to implementing rigorous evaluation frameworks for autonomous agents.

Timestamps:
0:00 - Introduction 0:25 - Part 1: Building a Speech Stack (Healthcare focus) 04:15 - Architecture & Workflow of a Speech Assistant 08:30 - Model Selection: Transformers vs. Distillation 12:46 - Part 2: Building Foundational Models (The "Why") 17:20 - Feature Exploration & Data Strategies 22:15 - Avoiding Common Pitfalls: Attention vs. Causation 26:42 - Part 3: Evaluating Agents & LLM-as-a-Judge 31:10 - Intro to MLflow for GenAI Evaluation 35:40 - Solving Bias in LLM Judges (Positional & Verbosity) 41:31 - Final Summary & Future Trends

What You’ll Learn:
Part 1: Building a Speech Stack for High-Stakes Domains (Suki)
Medical Domain Challenges: Handling complex terminology, background noise, and diverse accents.
The Architecture: A look at the full stack, from on-device wake-word detection to back-end state management.
Optimization: Why modeling is only 30% of the effort, and how to use distillation to achieve 500ms latency.
Data Strategy: Why quality beats quantity and the importance of expert verification from day one.

Part 2: Designing Foundational Models for the Enterprise (Robinhood)
The Power of Representations: Why foundational models accelerate experimentation across different company use cases.
Behavioral Encoding: Moving beyond proxy signals to capture true user behavior.
Caveats & Iteration: Understanding why "Attention is not Causation" and how to use ablations to find hidden correlations.
Efficiency: Using large models as "teachers" to distill smaller, cost-effective production models.

Part 3: Evaluating Agents using LLM-as-a-Judge (Databricks)
The Evaluation Crisis: Why BLEU and ROUGE fail in the "Year of the Agents."
LLM as a Judge: How to leverage models for scalable, human-aligned evaluation using MLflow.
Best Practices: Creating precise rubrics, scoring scales, and providing justifications (rationale) for scores.
Bias Mitigation: Strategies to overcome positional and verbosity bias in automated judging.

#AI #MachineLearning #LLM #SpeechRecognition #GenAI #Databricks #MLOps #Agents #FoundationalModels

Scaling AI: From Custom Speech Stacks to Evaluating Agents with LLMs

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

MLflow 3.0: AI and MLOps on Databricks

MLflow 3.0: AI and MLOps on Databricks

September San Francisco AI Engineers Tech Talk

September San Francisco AI Engineers Tech Talk

Как Россия учится летать на старых самолетах

Как Россия учится летать на старых самолетах

Building AI Products at Scale | Tadata & Nexla Engineers on LLMs, ML, Production

Building AI Products at Scale | Tadata & Nexla Engineers on LLMs, ML, Production

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Stanford CS230 | Autumn 2025 | Lecture 8: Agents, Prompts, and RAG

Stanford CS230 | Autumn 2025 | Lecture 8: Agents, Prompts, and RAG

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем

Экспресс-курс RAG для начинающих

Экспресс-курс RAG для начинающих

NYC AI Engineers September Tech Talk

NYC AI Engineers September Tech Talk

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

Глава Anthropic: как ИИ изменит бизнес за 18 месяцев

Глава Anthropic: как ИИ изменит бизнес за 18 месяцев

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

Что такое стек ИИ? Магистратура LLM, RAG и аппаратное обеспечение ИИ

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic

Introduction to Mosaic AI: How Databricks Simplifies Your GenAI Journey

Introduction to Mosaic AI: How Databricks Simplifies Your GenAI Journey

9 AI-навыков, которые должен освоить каждый в 2026 году

9 AI-навыков, которые должен освоить каждый в 2026 году

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

NYC AI Engineers Tech Talk - October 2025 | Real-World AI Engineering in Productio5

NYC AI Engineers Tech Talk - October 2025 | Real-World AI Engineering in Productio5

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com