Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Surya Ganguli | Statistical mechanics of neural networks

Автор: Harvard CMSA

Загружено: 2022-10-27

Просмотров: 2883

Описание:

New Technologies in Mathematics


Speaker: Surya Ganguli, Stanford University


Title: Statistical mechanics of neural networks: From the geometry of high dimensional error landscapes to beating power law neural scaling


Abstract: Statistical mechanics and neural network theory have long enjoyed fruitful interactions. We will review some of our recent work in this area and then focus on two vignettes. First we will analyze the high dimensional geometry of neural network error landscapes that happen to arise as the classical limit of a dissipative many-body quantum optimizer. In particular, we will be able to use the Kac-Rice formula and the replica method to calculate the number, location, energy levels, and Hessian eigenspectra of all critical points of any index. Second we will review recent work on neural power laws, which reveal that the error of many neural networks falls off as a power law with network size or dataset size. Such power laws have motivated significant societal investments in large scale model training and data collection efforts. Inspired by statistical mechanics calculations, we show both in theory and in practice how we can beat neural power law scaling with respect to dataset size, sometimes achieving exponential scaling, by collecting small carefully curated datasets rather than large random ones.
References: Y. Bahri, J. Kadmon, J. Pennington, S. Schoenholz, J. Sohl-Dickstein, and S. Ganguli, Statistical mechanics of deep learning, Annual Reviews of Condensed Matter Physics, 2020.
Sorscher, Ben, Robert Geirhos, Shashank Shekhar, Surya Ganguli, and Ari S. Morcos. 2022. Beyond Neural Scaling Laws: Beating Power Law Scaling via Data Pruning https://arxiv.org/abs/2206.14486 (NeurIPS 2022).

Surya Ganguli | Statistical mechanics of neural networks

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

João Araújo & Michael Kinyon | From Engine to Auto

João Araújo & Michael Kinyon | From Engine to Auto

DDPS | “A first-principles approach to understanding deep learning”

DDPS | “A first-principles approach to understanding deep learning”

France is AI 2018: Lenka Zdeborova - Statistical physics modelling of machine learning

France is AI 2018: Lenka Zdeborova - Statistical physics modelling of machine learning

Surya Ganguli - A mathematical theory of semantic development in deep neural networks

Surya Ganguli - A mathematical theory of semantic development in deep neural networks

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

ЛЕКЦИЯ ПРО НАДЁЖНЫЕ ШИФРЫ НА КОНФЕРЕНЦИИ БАЗОВЫХ ШКОЛ РАН В ТРОИЦКЕ

Сеть Хопфилда: как хранятся воспоминания в нейронных сетях? [Нобелевская премия по физике 2024 го...

Сеть Хопфилда: как хранятся воспоминания в нейронных сетях? [Нобелевская премия по физике 2024 го...

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Стоило ли покупать УБИТЫЙ MacBook за 6000₽? Вскрытие меня Удивило! Ремонт MacBook Pro 13 2013 a1502

Стоило ли покупать УБИТЫЙ MacBook за 6000₽? Вскрытие меня Удивило! Ремонт MacBook Pro 13 2013 a1502

49 минут, которые ИЗМЕНЯТ ваше понимание Вселенной | Владимир Сурдин

49 минут, которые ИЗМЕНЯТ ваше понимание Вселенной | Владимир Сурдин

Elon Musk Makes Shocking Future Predictions At The World Economic Forum In Davos

Elon Musk Makes Shocking Future Predictions At The World Economic Forum In Davos

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

Для Чего РЕАЛЬНО Нужен был ГОРБ Boeing 747?

Визуализация гравитации

Визуализация гравитации

Задача из вступительных Стэнфорда

Задача из вступительных Стэнфорда

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Symmetry and Universality - Dr Sophia Sanborn (Science)

Symmetry and Universality - Dr Sophia Sanborn (Science)

Гипотеза Пуанкаре — Алексей Савватеев на ПостНауке

Гипотеза Пуанкаре — Алексей Савватеев на ПостНауке

Unia Europejska upadnie? Co dalej z Europą?

Unia Europejska upadnie? Co dalej z Europą?

Теория струн (ScienceClic)

Теория струн (ScienceClic)

Алекс Дамиан | Понимание оптимизации в глубоком обучении с использованием центральных потоков

Алекс Дамиан | Понимание оптимизации в глубоком обучении с использованием центральных потоков

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com