Scraping a jobsite. To get a job...I want another bike

Автор: aussie wantok

Загружено: 2022-07-01

Просмотров: 216

Описание:

Instead of looking for work, I've set up a bot to give me a list of jobs that I can apply for

I'm excluding jobs with certain buzz words like SALES, RESTAURANT etc...

Tools I'm using, PyCharm, Python with BeautifulSoup and request packages

Source code at end of this description

0:00 intro
0:27 Indeed.com jobsite layout
1:04 Indeed.com URL
1:47 PyCharm and basic setup of packages
2:06 request.get() call
2:52 BeatifulSoup
3:11 finding HTML tags in the page
3:25 inspecting tags
4:21 getting first a tag
5:02 getting text and hyperlink from a tag
6:09 get all a tags with class from page
6:46 loop through list
7:57 drop unwanted jobs in list
8:55 sift through jobs - split(), loop, list.append()
10:23 first run
10:34 exclude more jobs
10:58 scrape the first 5 pages
12:12 following generated hyperlinks
12:46 outro

#python #beautifulsoup #indeed #lookingforwork

Source Code
---------------------
import requests
from bs4 import BeautifulSoup
no_no_jobs = ['SALE', 'RECEPTIONIST', 'RETAIL', 'COLES', 'SALES', 'JUNIOR', 'NURSE', 'BAR', 'NURSES', 'MEDICAL',
'SECURITY', 'ADMIN', 'PHYSIOTHERAPIST', 'OCCUPATIONAL', 'ENROLLED', 'TRAINEE', 'TABLELANDS', 'PODIATRIST',
'CARER', 'MASSAGE', 'THERAPIST', 'TOWNSVILLE', 'CHEF', 'BEAUTY', 'PATHOLOGIST', 'THERAPIST', 'BAR',
'AGED', 'RECEPTION', 'MAREEBA', 'CONSTRUCTION', 'BEVERAGE', 'LIBRARY', 'PHARMACY', 'ATTENDANT',
'HOSPITALITY', 'CLEANER', 'HOUSEKEEPING', 'CASINO', 'BARISTA', 'LINGERIE', 'MEDICAL', 'RETAIL',
'MERCHANDISER', 'MERCHANDISERS', 'WAIT', 'WAITING', 'YOUTH', 'RESTAURANT', 'BWS', 'HEALTH', 'WOOLWORTHS',
'WEIPA', 'HOTEL', 'MEDICAL', 'OFFICER']

final_list = []
for z in range(0, 100, 20):
response = requests.get(f"https://au.indeed.com/jobs?l=Cairns%2...{z}&vjk=087c224d4fda7669")
n = response.text

soup = BeautifulSoup(n, "html.parser")

my_a_tags = soup.find_all('a', class_="jcs-JobTitle")
print(len(my_a_tags))
temp_list = []
for i in range(len(my_a_tags)):
print(my_a_tags[i].getText())
print('https://au.indeed.com' + str(my_a_tags[i]['href']))
temp_list.append([my_a_tags[i].getText(), 'https://au.indeed.com' + str(my_a_tags[i]['href'])])

print(temp_list)
#
for i in temp_list:
split_title = i[0].split()
keep = True
for y in range(len(split_title)):
if split_title[y].upper() in no_no_jobs:
keep = False
if keep:
final_list.append(i)

for i in final_list:
print(i)
print(len(final_list))

exit()

Scraping a jobsite. To get a job...I want another bike

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Экосистема JavaScript проклята – npm снова взломали

Экосистема JavaScript проклята – npm снова взломали

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

🤷 AI обучен на говнокоде! Разработчиков компиляторов, протоколов и СУБД не хватает, а LLM не может

🤷 AI обучен на говнокоде! Разработчиков компиляторов, протоколов и СУБД не хватает, а LLM не может

Изучите Webflow: интенсивный курс для начинающих

Изучите Webflow: интенсивный курс для начинающих

Aurukun - ride through - 360 - VR - you control the view

Aurukun - ride through - 360 - VR - you control the view

Вам нужно изучить Docker ПРЯМО СЕЙЧАС!! // Docker-контейнеры 101

Вам нужно изучить Docker ПРЯМО СЕЙЧАС!! // Docker-контейнеры 101

Build a Responsive Sidebar Menu with Animated Dropdowns | HTML CSS JavaScript Project

Build a Responsive Sidebar Menu with Animated Dropdowns | HTML CSS JavaScript Project

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Исследовательский анализ данных с помощью Pandas Python

Исследовательский анализ данных с помощью Pandas Python

🧑‍💻 Собеседования и найм: алгоритмы, высокие нагрузки, использование LLM, IDE, стресс и лайвкодинг

🧑‍💻 Собеседования и найм: алгоритмы, высокие нагрузки, использование LLM, IDE, стресс и лайвкодинг

Падение "легенды": Фейковая ракета на вооружении армии России

Арестович, Латынина: Наступит мир после ухода Зеленского?

Арестович, Латынина: Наступит мир после ухода Зеленского?

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Лучший способ установки Windows 11 на любой ПК быстро и без проблем на любой ПК

Лучший способ установки Windows 11 на любой ПК быстро и без проблем на любой ПК

Docker за 20 минут

Docker за 20 минут

Deep House 2025 | Vocal House, English Deep House, Nu Disco, Chillout Mix | Intimate Mood

Deep House 2025 | Vocal House, English Deep House, Nu Disco, Chillout Mix | Intimate Mood

Алгоритмы на Python 3. Лекция №1

Алгоритмы на Python 3. Лекция №1

Маска подсети — пояснения

Маска подсети — пояснения

Linux Command Line for Beginners

Linux Command Line for Beginners

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана

Преломление и «замедление» света | По мотивам лекции Ричарда Фейнмана