Встреча разработчиков EuroLLVM 2019: Т. Йорг «Автоматизированное слияние ядра GPU с XLA»
Автор: LLVM
Загружено: 2019-04-27
Просмотров: 4412
http://llvm.org/devmtg/2019-04/
—
Автоматизированное слияние ядер GPU с помощью XLA — Томас Йорг (Google)
Слайды: http://llvm.org/devmtg/2019-04/slides...
—
XLA (Accelerated Linear Algebra) — это оптимизирующий компилятор для линейной алгебры, ускоряющий вычисления TensorFlow. Компилятор XLA переходит на LLVM IR и использует LLVM для низкоуровневой оптимизации и генерации кода. XLA обеспечивает значительный прирост производительности на моделях TensorFlow. Мы наблюдали ускорение до 3 раз на внутренних моделях. Популярная модель классификации изображений ResNet-50 обучается в 1,6 раза быстрее.
Ключевой оптимизацией, выполняемой XLA, является автоматизированное слияние ядер GPU. Идея заключается в объединении нескольких операторов линейной алгебры в одном ядре графического процессора для снижения требований к пропускной способности памяти и накладных расходов на запуск ядра. TensorFlow с XLA продемонстрировал конкурентоспособную производительность в тестах MLPerf (mlperf.org) по сравнению с фреймворками машинного обучения, использующими вручную объединенные и настроенные ядра графических процессоров.
—
Видео снято и смонтировано Bash Films: http://www.BashFilms.com
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: