Pythia: Kontrolowane laboratorium do badania LLM | Deep Dive

Автор: Głęboki Odczyt

Загружено: 2025-12-17

Просмотров: 4

Описание:

🎙️ Odkrywanie tajemnic uczenia maszynowego - w kontrolowany sposób! Pythia to przełomowy projekt badawczy, który po raz pierwszy umożliwia naukowcom dokładne śledzenie tego, jak wielkie modele językowe uczą się w czasie. 16 modeli, identyczne dane, 154 checkpointy dla każdego - to prawdziwe laboratorium dla LLM.

W tym odcinku omawiamy:
• Dlaczego potrzebowaliśmy kontrolowanego środowiska do badań nad LLM
• Mit #1: Architektura musi być optymalna dla każdej skali
• Mit #2: Deduplikacja danych zawsze poprawia wyniki
• Mit #3: Redukcja bias wymaga kosztownego fine-tuningu
• Mit #4: Model lepiej zapamiętuje dane z końca treningu
• Mit #5: Zdolności modeli rozwijają się stopniowo i płynnie
• Odkrycie: Zapamiętywanie jako proces Poissona
• Odkrycie: "Moment olśnienia" - nagła zmiana fazowa w uczeniu
• Pytanie na przyszłość: Czy istnieje spektrum interwencji treningowych?

📄 Oryginalny artykuł: https://arxiv.org/abs/2304.01373

Autorzy: Stella Biderman, Hailey Schoelkopf, Quentin Anthony, Herbie Bradley, Kyle O'Brien, Eric Hallahan, Mohammad Aflah Khan, Shivanshu Purohit, USVSN Sai Prashanth, Edward Raff, i inni (EleutherAI & kilka innych instytucji)

TAGI:
#AI #MachineLearning #DeepLearning #LLM #Pythia #EleutherAI #ResearchPaper #NLP #EmergentAbilities #Memorization #BiasReduction #ScalingLaws #LanguageModels #OpenScience

Pythia: Kontrolowane laboratorium do badania LLM | Deep Dive

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Powód Dla Którego Czas Nie Istnieje Na Poziomie Atomowym Jest Bardziej Zadziwiający

Powód Dla Którego Czas Nie Istnieje Na Poziomie Atomowym Jest Bardziej Zadziwiający

LLaVA: Wizualne Dostrajanie Instrukcyjne | Deep Dive

LLaVA: Wizualne Dostrajanie Instrukcyjne | Deep Dive

Bank Srebrnej Gospodarki - bilans 2025 i plany 2026

Bank Srebrnej Gospodarki - bilans 2025 i plany 2026

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Machu Picchu - jak nas okłamują

Machu Picchu - jak nas okłamują

Cała prawda o Danii! Miśko: To co robili na Grenlandii było straszne!

Cała prawda o Danii! Miśko: To co robili na Grenlandii było straszne!

Attention Is All You Need - Artykuł, który zmienił AI na zawsze | Deep Dive

Attention Is All You Need - Artykuł, który zmienił AI na zawsze | Deep Dive

Я проигнорировал все предупреждения о безопасности литиевых батарей... Ради науки!

Я проигнорировал все предупреждения о безопасности литиевых батарей... Ради науки!

34 lata ewolucji Strandbeest – zobacz niesamowitą przemianę!

34 lata ewolucji Strandbeest – zobacz niesamowitą przemianę!

Осьминог Vs Подводный Лабиринт

Осьминог Vs Подводный Лабиринт

Что такое квантовая теория

Что такое квантовая теория

LLaMA 3: Perfekcja w Niespotykane Skali | Deep Dive

LLaMA 3: Perfekcja w Niespotykane Skali | Deep Dive

Что такое СПИН? спин 1/2 и 3/2

Что такое СПИН? спин 1/2 и 3/2

Dlaczego psy nagle NA CIEBIE WCHODZĄ? (Powód szokuje)

Dlaczego psy nagle NA CIEBIE WCHODZĄ? (Powód szokuje)

КОЗЫРЕВ - астрофизик ДОКАЗАЛ, что ВРЕМЯ это ЭНЕРГИЯ: дважды СИДЕЛ, приговорён к РАССТРЕЛУ

КОЗЫРЕВ - астрофизик ДОКАЗАЛ, что ВРЕМЯ это ЭНЕРГИЯ: дважды СИДЕЛ, приговорён к РАССТРЕЛУ

6 ДРЕВНИХ СООРУЖЕНИЙ, ПОХОЖИЕ НА АРХИТЕКТУРУ БУДУЩЕГО

6 ДРЕВНИХ СООРУЖЕНИЙ, ПОХОЖИЕ НА АРХИТЕКТУРУ БУДУЩЕГО

Самая холодная деревня в мире: Оймякон (-71°C)

Самая холодная деревня в мире: Оймякон (-71°C)

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

Глава DeepMind: миллионы ИИ-агентов выйдут в интернет - и это меняет всё

Mamba-2: Transformery to SSM-y. Synteza Dwóch Światów AI | Deep Dive

Mamba-2: Transformery to SSM-y. Synteza Dwóch Światów AI | Deep Dive