Решение проблем в инфраструктуре ИИ
Автор: Red Hat
Загружено: 2025-12-12
Просмотров: 245
Масштабирование инфраструктуры ИИ для удовлетворения растущего спроса сопряжено с серьёзными проблемами, связанными со стоимостью, контролем и производительностью. Уилл Макграт, Джеймс Хармисон и Филип Хейс из Red Hat рассматривают три подхода к решению этих проблем, используя возможности платформ с открытым исходным кодом и масштабируя данные для повышения производительности.
Узнайте, как такие компании, как Turkish Airlines, оптимизируют ресурсы графических процессоров в гибридных облачных средах, и как модели как услуга и масштабируемый вывод решают проблему дублирования и помогают добиться стабильной производительности моделей ИИ в рабочей среде.
00:00 Введение
02:08 Три подхода к масштабированию инфраструктуры ИИ
02:41 GPU-as-a-Service: оптимизация ресурсов графических процессоров
05:12 Демонстрация
14:57 Models-as-a-Service
17:26 Инфраструктура сегодня, стратегия завтра
19:30 Быстрый, гибкий и масштабируемый вывод
21:50 Знакомство с llm-d
24:20 Демонстрация
29:33 Заключение
🚀 Ознакомьтесь с нашим портфолио решений для ИИ: https://www.redhat.com/en/products/ai
#RedHat #AI #llmd
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: