Nauka o Danych z Pythonem: Wikitekst, API Wikipedii
Автор: Włodzimierz Lewoniewski
Загружено: 2025-04-05
Просмотров: 245
W tej lekcji krok po kroku nauczysz się, jak dzięki oficjalnemu API Wikipedii pobierać programowo surowy kod wiki (wiki tekst) artykułów Wikipedii, przetwarzać go w Pythonie oraz zapisywać lokalnie. Zobaczysz cały przepływ pracy: od ręcznego podglądu kodu HTML, przez testy w „piaskownicy” API i analizę odpowiedzi JSON, aż po hurtowe pobieranie wielu stron naraz. Po ukończeniu lekcji będziesz w stanie pobierać pojedyncze artykuły lub całe zbiory do analiz danych, budowy korpusów dla modeli ML, automatycznego tłumaczenia czy własnych aplikacji.
Co będziesz potrafić po kursie:
🔴 Testować zapytania API – ustawiać parametry w środowisku testowym Wikipedii i podglądać odpowiedzi.
🔴 Budować zapytania w Pythonie – korzystać z urllib i requests, zapisywać dane JSON.
🔴 Wyodrębniać wiki tekst – przechodzić po kluczach JSON i zapisywać czystą wikiskładnię.
🔴 Pobierać wiele artykułów naraz – iterować po listach stron i łączyć wyniki w jednym pliku.
🔴 Położyć fundament pod projekty zaawansowane – używać strumienia danych Wikipedii w text‑miningu, korpusach ML czy własnych narzędziach webowych.
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: