Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

How to Implement Deep Learning Applications for NVIDIA GPUs with GPU Coder

Автор: MATLAB

Загружено: 2018-01-10

Просмотров: 5576

Описание:

GPU Coder™ generates readable and portable CUDA® code that leverages CUDA libraries like cuBLAS and cuDNN from the MATLAB® algorithm, which is then cross-compiled and deployed to NVIDIA® GPUs from the Tesla® to the embedded Jetson™ platform.
Learn more about GPU Coder: https://goo.gl/SM86S3
Download a free Deep Learning ebook: https://bit.ly/2K9zZ2s

The first part of this talk describes how MATLAB is used to design and prototype end-to-end systems that include a deep learning network augmented with computer vision algorithms. You’ll learn about the affordances in MATLAB to access and manage large data sets, as well as pretrained models to quickly get started with deep learning design. Then, you’ll see how distributed and GPU computing capabilities integrated with MATLAB are employed during training, debugging, and verification of the network. Finally, most end-to-end systems need more than just classification: Data needs to be pre- and post-processed before and after classification. The results are often inputs to a downstream control system. These traditional computer vision and control algorithms, written in MATLAB, are used to interface with the deep learning network to build up the end-to-end system.

The second part of this talk focuses on the embedded deployment phase. Using representative examples from automated driving to illustrate the entire workflow, see how GPU Coder automatically analyzes your MATLAB algorithm to (a) partition the MATLAB algorithm between CPU/GPU execution; (b) infer memory dependencies; (c) allocate to the GPU memory hierarchy (including global, local, shared, and constant memories); (d) minimize data transfers and device-synchronizations between CPU and GPU; and (e) finally generate CUDA code that leverages optimized CUDA libraries like cuBLAS and cuDNN to deliver high-performance.

Finally, you’ll see that the generated code is highly optimized with benchmarks that show that deep learning inference performance of the auto-generated CUDA code is ~2.5x faster for mxNet, ~5x faster for Caffe2, and ~7x faster for TensorFlow®.

Watch this talk to learn how to:

1. Access and manage large image sets

2. Visualize networks and gain insight into the training process

3. Import reference networks such as AlexNet and GoogLeNet

4. Automatically generate portable and optimized CUDA code from the MATLAB algorithm

How to Implement Deep Learning Applications for NVIDIA GPUs with GPU Coder

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Using GPU Coder to Prototype and Deploy on NVIDIA Drive, Jetson

Using GPU Coder to Prototype and Deploy on NVIDIA Drive, Jetson

Getting Started with CUDA and Parallel Programming | NVIDIA GTC 2025 Session

Getting Started with CUDA and Parallel Programming | NVIDIA GTC 2025 Session

Deep Learning on Jetson AGX Xavier using MATLAB, GPU Coder, and TensorRT

Deep Learning on Jetson AGX Xavier using MATLAB, GPU Coder, and TensorRT

Все, что вам нужно знать о теории управления

Все, что вам нужно знать о теории управления

Stanford Seminar - NVIDIA GPU Computing: A Journey from PC Gaming to Deep Learning

Stanford Seminar - NVIDIA GPU Computing: A Journey from PC Gaming to Deep Learning

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

GPU для deep learning. Как выбрать видеокарту для обучения нейронных сетей?

GPU для deep learning. Как выбрать видеокарту для обучения нейронных сетей?

Deploy YOLOv2 to an NVIDIA Jetson

Deploy YOLOv2 to an NVIDIA Jetson

Introduction to Parallel/GPU computing using MATLAB

Introduction to Parallel/GPU computing using MATLAB

Обнаружение объектов в реальном времени с помощью 10 строк кода Python на Jetson Nano

Обнаружение объектов в реальном времени с помощью 10 строк кода Python на Jetson Nano

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

How to Setup NVIDIA GPU For Deep Learning | Installing Cuda Toolkit And cuDNN

How to Setup NVIDIA GPU For Deep Learning | Installing Cuda Toolkit And cuDNN

Writing Code That Runs FAST on a GPU

Writing Code That Runs FAST on a GPU

Nvidia CUDA in 100 Seconds

Nvidia CUDA in 100 Seconds

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

Где начало СХЕМЫ? Понимаем, читаем, изучаем схемы. Понятное объяснение!

CUDA Part A: GPU Architecture Overview and CUDA Basics; Peter Messmer (NVIDIA)

CUDA Part A: GPU Architecture Overview and CUDA Basics; Peter Messmer (NVIDIA)

Как работают глубокие нейронные сети

Как работают глубокие нейронные сети

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Вся IT-база в ОДНОМ видео: Память, Процессор, Код

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com