Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

einspace: Searching for Neural Architectures from Fundamental Operations

Автор: AutoML Seminars

Загружено: 2024-09-06

Просмотров: 457

Описание:

Title: einspace: Searching for Neural Architectures from Fundamental Operations

Speaker: Linus Eriksson (https://linusericsson.github.io/)

Abstract:
Neural architecture search (NAS) finds high performing networks for a given task. Yet the results of NAS are fairly prosaic; they did not e.g. create a shift from convolutional structures to transformers. This is not least because the search spaces in NAS often aren’t diverse enough to include such transformations a priori. Instead, for NAS to provide greater potential for fundamental design shifts, we need a novel expressive search space design which is built from more fundamental operations. To this end, we introduce einspace, a search space based on a parameterised probabilistic context-free grammar. Our space is versatile, supporting architectures of various sizes and complexities, while also containing diverse network operations which allow it to model convolutions, attention components and more. It contains many existing competitive architectures, and provides flexibility for discovering new ones. Using this search space, we perform experiments to find novel architectures as well as improvements on existing ones on the diverse Unseen NAS datasets. We show that competitive architectures can be obtained by searching from scratch, and we consistently find large improvements when initialising the search with strong baselines. We believe that this work is an important advancement towards a transformative NAS paradigm where search space expressivity and strategic search initialisation play key roles.

Project page: https://linusericsson.github.io/einsp...

Code: https://github.com/linusericsson/eins...

Paper: https://arxiv.org/abs/2405.20838

einspace: Searching for Neural Architectures from Fundamental Operations

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Иллюстрированное руководство по нейронной сети Transformers: пошаговое объяснение

Иллюстрированное руководство по нейронной сети Transformers: пошаговое объяснение

Все, что вам нужно знать о теории управления

Все, что вам нужно знать о теории управления

GitHub - ai-dynamo/dynamo: A Datacenter Scale Distributed Inference Serving Framework

GitHub - ai-dynamo/dynamo: A Datacenter Scale Distributed Inference Serving Framework

Understanding High-Dimensional Bayesian Optimization

Understanding High-Dimensional Bayesian Optimization

Управление поведением LLM без тонкой настройки

Управление поведением LLM без тонкой настройки

Problems in the current research on forecasting with transformers, foundational models, etc.

Problems in the current research on forecasting with transformers, foundational models, etc.

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Написал нейросети для рисования | Как работает DeepDream?

Написал нейросети для рисования | Как работает DeepDream?

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

Объяснение сверточных нейронных сетей (визуализация CNN)

Объяснение сверточных нейронных сетей (визуализация CNN)

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues

Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues

Будет ли встраиваемые системы по-прежнему привлекательной карьерой в 2026 году?

Будет ли встраиваемые системы по-прежнему привлекательной карьерой в 2026 году?

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Декораторы Python — наглядное объяснение

Декораторы Python — наглядное объяснение

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Новый курс обучения DeepSeek LLM - Гиперсоединения с ограничениями многообразия (mHC)

Объяснение Transformers: понимание модели, лежащей в основе GPT, BERT и T5

Объяснение Transformers: понимание модели, лежащей в основе GPT, BERT и T5

Scaling Exponents Across Parameterizations and Optimizers

Scaling Exponents Across Parameterizations and Optimizers

Understanding the Discrete Fourier Transform and the FFT

Understanding the Discrete Fourier Transform and the FFT

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com