Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Основы requests и bs4 за 44 минуты. Видео 1

Автор: Алексей Ротмистров

Загружено: 2022-07-01

Просмотров: 1151

Описание:

Praylist    • Основы пакетов requests , bs4 , re  
0:00 Содержательная задача: выгрузить с сайта FL.ru информацию о конкурсах для фрилансеров и о реакции фрилансеров на них, чтобы впоследствии выяснить детерминанты (не)популярности конкурсов.
0:30 Архитектура веб-источника: 3 раздела сайта FL.ru .
1:05 Интересующие переменные.
3:15 Архитектура скриптов.
3:30 Упоминание реляционных баз данных.
4:05 Итоговая таблица.
5:45 Статья «Автоматическое извлечение текстовых и числовых веб-данных для целей социальных наук» https://www.jour.fnisc.ru/index.php/s... .
6:10 robots.txt .
6:35 Корректировка содержательной задачи.
7:15 Полезный пререквизит: видео «Эффективно программировать на Python в Jupyter Notebook»    • Эффективно программировать на Python в Jup...   .
7:45 Markdown и закомменчивание.
8:15 Скачать пакеты из Интернета на компьютер.
8:55 Активировать пакет requests. Записать в объект. Класс объектов «текст». Кавычки.
9:30 Альтернативные точки входа.
11:35 Маскировка алгоритмического запроса под запрос обычного пользователя; Cookie и User-Agent. Класс объектов «словарь».
15:10 Заменить класс объекта 'объект requests' на класс объекта 'текст'. Функции (методы) и атрибуты.
16:25 Активировать класс BeautifulSoup из пакета bs4 . HTML-теги, их атрибуты и содержимое.
17:35 "Название конкурса". Ограничить область поиска искомого текста в выгруженном HTML-коде посредством релевантного тега из веб-инспектора. Почему не span id="prj_name_5007925" . Методы .find_all() и .find() и HTML-теги. Вспомогательные чанки.
19:20 Метод find_all , класс объектов «список» и индексирование.
22:25 Метод get_text пакета bs4 и метод strip для текста. Применимость методов только к объектам "своего" класса. Классы данных и классы модулей.
24:25 Промежуточные итоги.
28:10 Блок "Заказчик конкурса", "Дата регистрации заказчика". В искомом тексте много лишних символов. Оптимальное, но сложно для понимания решение пакетом re. Упоминание пакета re .
30:00 Цикл while , чтобы заменить все двойные пробелы на одинарные.
31:20 "Бюджет". Двойное ограничение области поиска. Конкатенировать.
33:40 Цикл for для итерирования диапазона элементов.
37:35 Иллюстрация различия оптимальности в компьютерных науках и в DCSS (цифровых и вычислительных социальных науках).
38:55 Оформить переменные. Пакет pandas. Датафреймы. Индексировать датафрейм на запись.
42:35 Сохранить датафрейм в формате экселевской таблицы.
43:25 Итоговый чанк.

Основы requests и bs4 за 44 минуты. Видео 1

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Основы requests и bs4. Схема парсинга. Видео 2

Основы requests и bs4. Схема парсинга. Видео 2

Как начать текст-майнинг?

Как начать текст-майнинг?

Остановка боевых действий? / Москва озвучила главное требование

Остановка боевых действий? / Москва озвучила главное требование

Лекция Гидравлика 27.09.25

Лекция Гидравлика 27.09.25

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Как устроен PHP 🐘: фундаментальное знание для инженеров

Как устроен PHP 🐘: фундаментальное знание для инженеров

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Основы пакетов requests , bs4 , re

Основы пакетов requests , bs4 , re

Эффективно программировать на Python в Jupyter Notebook

Эффективно программировать на Python в Jupyter Notebook

Арестович: Был ли удар по спецобъекту РФ? Зеленский играет против Трампа?

Арестович: Был ли удар по спецобъекту РФ? Зеленский играет против Трампа?

Миллиарды на ветер: Су-57 - главный авиационный миф России

Миллиарды на ветер: Су-57 - главный авиационный миф России

ООП На Простых Примерах | Объектно-Ориентированное Программирование

ООП На Простых Примерах | Объектно-Ориентированное Программирование

«Атака» на резиденцию Путина: Трамп зол, Лавров угрожает. Из Наоко хотели сделать второго Шамана

«Атака» на резиденцию Путина: Трамп зол, Лавров угрожает. Из Наоко хотели сделать второго Шамана

SHAZAM Top 50🏖️Лучшая Музыка 2025🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #40

SHAZAM Top 50🏖️Лучшая Музыка 2025🏖️Зарубежные песни Хиты🏖️Популярные Песни Слушать Бесплатно #40

selenium на Python за 25 минут: автоматизированная выгрузка FinAM

selenium на Python за 25 минут: автоматизированная выгрузка FinAM

API YouTube. Семь тысяч комментариев за четыре минуты

API YouTube. Семь тысяч комментариев за четыре минуты

Как изменилась война за год?

Как изменилась война за год?

Предел развития НЕЙРОСЕТЕЙ

Предел развития НЕЙРОСЕТЕЙ

Алгоритмы на Python 3. Лекция №1

Алгоритмы на Python 3. Лекция №1

Путин и чиновники кинули россиян. Итоги 2025

Путин и чиновники кинули россиян. Итоги 2025

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]