DNS for Platform Engineering: The Silent Killer

Автор: platform-engineering-playbook

Загружено: 2025-11-13

Просмотров: 5

Описание:

Why does a forty-year-old protocol keep taking down billion-dollar infrastructure? The October 2024 AWS outage lasted fifteen hours because of a DNS race condition. Kubernetes defaults create 5x query amplification. We investigate how DNS really works in modern platforms—CoreDNS plugin chains, the ndots:5 trap, GSLB failover—and deliver the five-layer defensive playbook to prevent your platform from becoming the next postmortem.

🔗 Full episode page: https://platformengineeringplaybook.c...

📝 See a mistake or have insights to add? This podcast is community-driven - open a PR on GitHub!

Summary:
• CoreDNS plugin-based architecture: middleware → backend chain, Kubernetes plugin watches API server and generates responses on-the-fly for cluster.local, forward plugin handles external queries
• ndots:5 trap creates 5x DNS query amplification—api.stripe.com tries 4 search domains before absolute query; fix by lowering to ndots:1, using FQDNs with trailing dot, implementing app-level caching
• AWS October 19-20, 2024 outage: two DNS Enactors racing in DynamoDB DNS automation, cleanup deleted all IPs for regional endpoint, 15+ hours of cascading failures (DynamoDB → dependent services → Slack/Atlassian/Snapchat)
• Five-layer defensive playbook: (1) optimize—fix ndots, tune CoreDNS cache to 10K records/30s, latency less than 100ms warning; (2) failover—GSLB with health checks, TTL 60-300s for backends; (3) security—DNSSEC + DoH with internal resolvers; (4) monitoring—track p95 latency, error rates by type, top requesters; (5) testing—DNS failure game days, kill CoreDNS pods, inject latency, model failover scenarios
• TTL balancing trade-off: low TTL (60-300s) enables fast failover but increases query load; high TTL (3600-86400s) improves performance but delays failover; no perfect answer, depends on SLO

DNS for Platform Engineering: The Silent Killer

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

75% of Your Team Uses Unauthorized AI - Why Your Blocking Strategy Backfires

75% of Your Team Uses Unauthorized AI - Why Your Blocking Strategy Backfires

Kubernetes — Простым Языком на Понятном Примере

Kubernetes — Простым Языком на Понятном Примере

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Мультигигабитный Ethernet 2.5Gb и 5Gb. Что это, для кого нужен и откуда он УЖЕ в твоём доме?

Мультигигабитный Ethernet 2.5Gb и 5Gb. Что это, для кого нужен и откуда он УЖЕ в твоём доме?

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Service Mesh Showdown: Why User-Space Beat eBPF

Service Mesh Showdown: Why User-Space Beat eBPF

helloSystem - macOS для бедных? | Первый взгляд

helloSystem - macOS для бедных? | Первый взгляд

Точка зрения: что вы увидите во время захвата искусственным интеллектом

Точка зрения: что вы увидите во время захвата искусственным интеллектом

PiHole или AdGuard Home: что подойдет именно вам?

PiHole или AdGuard Home: что подойдет именно вам?

Что такое "Reverse Engineering". Показываю как ломают софт.

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Вы думали, что допинг — это плохо? Подождите, пока не услышите об электромагнитных велосипедах.

Сети для несетевиков // OSI/ISO, IP и MAC, NAT, TCP и UDP, DNS

Сети для несетевиков // OSI/ISO, IP и MAC, NAT, TCP и UDP, DNS

NAS Системы. Сохранность данных. Сравнение. Как не потратить деньги и время зря...

NAS Системы. Сохранность данных. Сравнение. Как не потратить деньги и время зря...

Раскрываем потенциал Netis NX31 с помощью OpenWrt

Раскрываем потенциал Netis NX31 с помощью OpenWrt

Контроллер электромагнитной плиты и вообще о плитах

Контроллер электромагнитной плиты и вообще о плитах

10 Platform Engineering Anti-Patterns That Kill Developer Productivity | DORA 2024

10 Platform Engineering Anti-Patterns That Kill Developer Productivity | DORA 2024

История компании Dell: компьютеры, бизнес-модель, конкуренты и интернет

История компании Dell: компьютеры, бизнес-модель, конкуренты и интернет

APACHE VS NGINX. Что выбрать? Сравнение двух популярных HTTP серверов.

APACHE VS NGINX. Что выбрать? Сравнение двух популярных HTTP серверов.

KDE Plasma 6. Самая функциональная среда. Плавающая панель. 3D Куб. Полный переход на Wayland

KDE Plasma 6. Самая функциональная среда. Плавающая панель. 3D Куб. Полный переход на Wayland

Kubernetes AI Conformance: The End of AI Infrastructure Chaos | Platform Engineering Playbook

Kubernetes AI Conformance: The End of AI Infrastructure Chaos | Platform Engineering Playbook