Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Build a Deep Research Agent for Enterprise Data with Scalable Performance

Автор: Microsoft Reactor

Загружено: 2026-01-22

Просмотров: 509

Описание:

Brought to you by Microsoft and NVIDIA

Move beyond foundational concepts and dive into production-grade deployment of enterprise research agents. This session explores advanced architecture patterns for scaling NVIDIA AI-Q Blueprints and Nemotron models on Azure Kubernetes Services (AKS), focusing on real-world optimization strategies, performance tuning, and operational best practices.

Learn how to leverage NVIDIA NIM microservices alongside Nemotron's open-source models to build intelligent agents that reason across complex enterprise data, with practical insights on cost optimization, reliability, and multi-agent orchestration in Kubernetes environments

📌 This episode is a part of a series. Learn more: https://aka.ms/AIAgentsApps/y-MSFT

Chapters:
1:43 Welcome & Housekeeping
1:58 Code of Conduct Reminder
2:10 Chat & Links Overview
2:15 Recording Information
2:23 Speaker Introductions
2:48 Session Agenda
3:41 NVIDIA & Microsoft Collaboration
4:50 NVIDIA Hardware on Azure
5:31 NVIDIA AI Enterprise Overview
6:16 NeMoTron Open Model Family
7:57 Model Efficiency & Openness
8:20 NeMoTron 3 Architecture
9:57 Reinforcement Learning & Context Window
10:50 NIM Containers Overview
12:17 Open‑Source & Domain‑Specific NIMs
12:26 NVIDIA Enterprise on Azure Marketplace
17:27 Blueprint Overview
18:06 Blueprint Components
19:46 Deep Researcher Workflow
21:19 Architecture Walkthrough
23:05 Deep Researcher UI Demo
25:07 AKS Deployment Intro
26:05 RAG & AIQ Blueprints in AKS
28:00 Observability & Metrics Overview
29:04 Kubernetes & Telemetry
30:13 Deployment Workshop Overview
34:00 Cloud Shell Setup
35:52 GPU Operator Deployment
43:15 RAG Blueprint Deployment
45:52 Model Deployment Options
46:32 AIQ Model on AKS
47:26 Collection Loading
47:52 Testing & Research Demo
54:02 GPU & System Metrics
56:01 Autoscaling with HPA/KEDA
58:24 Closing Remarks & Speaker Contact
1:00:06 Survey & Wrap‑Up

[eventID:26622]

Build a Deep Research Agent for Enterprise Data with Scalable Performance

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Run open models on Serverless GPUs

Run open models on Serverless GPUs

So you want to work with Microsoft Fabric?

So you want to work with Microsoft Fabric?

Meet the winners of the 2025 Power BI Dataviz World Championships

Meet the winners of the 2025 Power BI Dataviz World Championships

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Claude за 20 минут: Полный курс для новичков

Claude за 20 минут: Полный курс для новичков

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

Роботы, Которых Никто Не Ожидал Увидеть на CES 2026

Model Context Protocol (MCP) Explained for Beginners: AI Flight Booking Demo!

Model Context Protocol (MCP) Explained for Beginners: AI Flight Booking Demo!

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Я УДАЛИЛ Claude Code – Вот, что я использую сейчаc

Новости ИИ: Душа Claude, Сингулярность в этом году, Krea убивает фотошоп?

Новости ИИ: Душа Claude, Сингулярность в этом году, Krea убивает фотошоп?

С нуля до миллионов на AI‑стартапах. Что отличает прототип от реального бизнеса  | Максим Панфилов

С нуля до миллионов на AI‑стартапах. Что отличает прототип от реального бизнеса | Максим Панфилов

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

MCP vs API: Simplifying AI Agent Integration with External Data

MCP vs API: Simplifying AI Agent Integration with External Data

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Профессор Ю.Н. Харари: угрозы и риски ИИ в будущем (Давос 2026)

Профессор Ю.Н. Харари: угрозы и риски ИИ в будущем (Давос 2026)

49 минут, которые ИЗМЕНЯТ ваше понимание Вселенной | Владимир Сурдин

49 минут, которые ИЗМЕНЯТ ваше понимание Вселенной | Владимир Сурдин

Скиллы Google Antigravity Это ЧИТЕРСТВО?

Скиллы Google Antigravity Это ЧИТЕРСТВО?

Being a data analyst in the era of AI (APAC)

Being a data analyst in the era of AI (APAC)

Почему Максим Кац* не видит больше смысла в объединении оппозиции / Утренний разворот

Почему Максим Кац* не видит больше смысла в объединении оппозиции / Утренний разворот

Смертельная ошибка в 0.1 Вольта: Почему горят параллельные сборки?

Смертельная ошибка в 0.1 Вольта: Почему горят параллельные сборки?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com