Извлечение данных из желтых страниц
Автор: Web Scraping with Franek
Загружено: 2023-02-23
Просмотров: 6614
📌 Узнайте, как извлечь номера телефонов и адреса электронной почты из справочника «Жёлтые страницы» США! 📌
«Жёлтые страницы» — это настоящая находка для сбора контактов малого бизнеса, включая адреса электронной почты и номера телефонов, чего нет в Google Картах.
🎁 Получите первые 100 B2B-лидов бесплатно: https://scrap.id/s/1xY
📥 Скачайте Octoparse: https://bit.ly/3F3r3rl
💰 Скидка 20% по купону: REP20
📩 Нужна услуга веб-скрапинга? Свяжитесь со мной: [email protected]
Что вы узнаете в этом видео
✅ Как настроить пагинацию для парсинга нескольких страниц
✅ Как циклически перебирать данные о компаниях
✅ Извлечение названий, номеров телефонов, адресов электронной почты, адресов и веб-сайтов
✅ Очистка данных с помощью регулярных выражений (RegEx)
✅ Оптимизация селекторов XPath для повышения точности
✅ Эффективный и безопасный запуск парсера
Временные метки
⏱ 01:47 — Вставка URL
⏱ 01:57 — Создание пагинации
⏱ 03:28 — Создание элемента цикла
⏱ 06:11 — Переход на страницу с подробностями
⏱ 07:33 — Извлечение данных
⏱ 08:43 — Очистка и оптимизация данных
⏱ 11:19 — Запуск задачи и экспорт результатов
XPath, используемые в этом Руководство
📌 Пагинация: //a[@class="next ajax-page"]
📌 Элемент цикла: //div[@class="result"]
📌 Элемент клика: //a[@class="business-name"]
📌 Заголовок: //h1
📌 Телефон: //p[@class="phone"]
📌 Адрес: //span[contains(text(),"Address:")]/..
📌 Веб-сайт: //p[@class="website"]/a
📌 Электронная почта: //a[@class="email-business"]
📌 Диапазон цен: //dt[text()="Price Range"]/following-sibling::dd[1]
Зачем парсить «Желтые страницы»?
🔹 Проще парсить, чем Google Карты
🔹 Извлекает адреса электронной почты и контактную информацию напрямую
🔹 Идеально подходит для лидогенерации и поиска клиентов в сфере B2B
🔹 Настройка Octoparse без кода упрощает процесс
Инструменты, используемые в этом видео
🛠 Octoparse — инструмент для парсинга веб-страниц без кода
🛠 XPath Helper — расширение для Chrome для тестирования запросов XPath
🛠 Google Chrome DevTools — проверка и извлечение элементов
👍 Подпишитесь и поставьте лайк, чтобы увидеть больше обучающих материалов по парсингу веб-страниц!
📩 Нужна помощь? Оставьте комментарий ниже или свяжитесь со мной для консультации и услуг.
#ВебСкрапинг #ЖёлтыеСтраницы #Автоматизация #Octoparse #ГенерацияЛидов #БезКода
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: