Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

PyData Stack: Pure Python open source data platforms

Автор: PyData

Загружено: 2025-10-28

Просмотров: 620

Описание:

🔊 Recorded at PyCon DE & PyData 2025, April 23, 2025
https://2025.pycon.de/program/PRRPQ3/

🎓 A practical guide to building production-ready data platforms using pure Python tools, demonstrated through Star Wars franchise analytics.

Speakers:
Eric Thanenthiran

Description:
This presentation examines the implementation of pure Python open source data platforms, focusing on practical architecture and tooling choices for small to medium-scale data operations. Thanenthiran demonstrates the construction of a complete data stack using Star Wars datasets as an example, incorporating five key components: data sources, pipelines, data storage, transformation, and orchestration. The stack utilizes DLT for data pipelines, DuckDB for storage, DBT for transformations, Dagster for orchestration, and Streamlit for visualization. The presentation addresses critical considerations in data platform development, including schema evolution, data quality testing, and lineage tracking. Particular attention is given to the medallion architecture approach, progressing data through raw, staging, domain, and curated layers. The implementation demonstrates handling both API and file-based data sources, transformation logic management, and effective data visualization for non-technical stakeholders. While the demonstrated stack is optimized for batch processing of datasets up to tens of gigabytes, Thanenthiran discusses considerations for scaling and alternatives for larger implementations. The presentation emphasizes practical implementation patterns and real-world considerations in data platform development, providing insights for engineers building initial data infrastructure.

⭐️ About PyCon DE & PyData:
The PyCon DE & PyData conference unite the Python, AI, and data science communities, offering a unique platform for collaboration and innovation. The PyCon DE & PyData 2025 conference, provided an exceptional experience, fostering deeper connections within the Python community while showcasing advancements in AI and data science. Attendees enjoyed a diverse and engaging program, solidifying the event as a highlight for Python and AI enthusiasts nationwide.

Follow us:
• LinkedIn:   / 28908640  
• X: https://www.x.com/pyconde

Links:
• Conference website: http://pycon.de
• Other sessions: https://2025.pycon.de/talks/

The conference is organized by
• Python Softwareverband e.V.: http://pysv.org
• NumFOCUS Inc.: http://numfocus.org
• Pioneers Hub gemeinnützige GmbH: http://pioneershub.org


If you enjoyed this session, please like, comment, and subscribe to our channel for more insightful talks and discussions.
Share this video with your network to spread the knowledge!

Hashtags:
#Python #PyConDE #PyData #OpenSource #AI #DataScience #MachineLearning #SoftwareDevelopment #LLMs #Community

Acknowledgements:
Special thanks to all the volunteers and sponsors who made this event possible.

About:
Python Softwareverband e.V.:
PySV is a non-profit that promotes the use and development of Python in Germany through events, education, and advocacy, fostering an open Python community.

NumFOCUS Inc.
supports open-source scientific computing by providing financial and logistical support to key projects like NumPy and Jupyter, promoting sustainable development and collaboration.

Pioneers Hub gemeinnützige GmbH:
is a non-profit fostering innovation in AI and tech by connecting experts and promoting knowledge exchange through events and collaborative initiatives.
www.pydata.org

PyData is an educational program of NumFOCUS, a 501(c)3 non-profit organization in the United States. PyData provides a forum for the international community of users and developers of data analysis tools to share ideas and learn from each other. The global PyData network promotes discussion of best practices, new approaches, and emerging technologies for data management, processing, analytics, and visualization. PyData communities approach data science using many languages, including (but not limited to) Python, Julia, and R.

PyData Stack: Pure Python open source data platforms

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Deepyaman Datta-✕-Data engineering with Python the right way-  -PyData Boston 2025

Deepyaman Datta-✕-Data engineering with Python the right way- -PyData Boston 2025

Benchmarking Time Series Foundation Models with sktime

Benchmarking Time Series Foundation Models with sktime

От бумажных карт до агентного ИИ: беседа с Джоном Холлингсвортом (Clear Channel Outdoor)

От бумажных карт до агентного ИИ: беседа с Джоном Холлингсвортом (Clear Channel Outdoor)

Создавайте профессиональные архитектурные схемы с помощью ИИ бесплатно, используя Python и Github...

Создавайте профессиональные архитектурные схемы с помощью ИИ бесплатно, используя Python и Github...

SQL Data Warehouse Portfolio Project

SQL Data Warehouse Portfolio Project

Docling + LangExtract 🚀 : Unlocking Unstructured Data

Docling + LangExtract 🚀 : Unlocking Unstructured Data

Python for AI & Agents - Full Beginner Course

Python for AI & Agents - Full Beginner Course

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Я случайно создал приложение на работе. Gemini Canvas + NotebookLM гайд.

Я случайно создал приложение на работе. Gemini Canvas + NotebookLM гайд.

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

От AI до Spotify: 682 Distribution обзор 🚀 Создание + Дистрибуция в одной платформе

От AI до Spotify: 682 Distribution обзор 🚀 Создание + Дистрибуция в одной платформе

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

17 Python Libraries Every AI Engineer Should Know

17 Python Libraries Every AI Engineer Should Know

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

What is a Data Pipeline! Data Pipelines Explained for Beginnes!

What is a Data Pipeline! Data Pipelines Explained for Beginnes!

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Zettelkasten + AI: Как я связал ChatGPT и Obsidian в единую систему знаний

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

How to Build Data Pipelines for ML Projects (w/ Python Code)

How to Build Data Pipelines for ML Projects (w/ Python Code)

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com