Інтерв'ю на позицію Data Scientist/Machine Learning Engineer
Автор: Ганна Пилєва: дивовижний data-світ
Загружено: 2025-01-30
Просмотров: 2382
Мій курс "Machine learning для людей": https://datalovesyou.com/big-products...
У цьому відео я проводжу mock-інтерв’ю (пробне інтерв'ю) на позицію Machine Learning Engineer для випускниці мого піврічного навчання "Machine learning для людей" Анастасії / anastasiia-mostova .
Анастасія перед початком поділилась зі мною вакансією, на яку ми будемо проводити тестове інтервʼю. Вакансія задала напрям і пріоритет питань. Анастасія не знала, що саме я буду запитувати.
Спочатку як і в справжньому бойовому інтервʼю я питаю про мотивацію Анастасії щодо обраної вакансії та далі ми проходимось по типовому флоу інтервʼю на посаду Data Scientist/Machine Learning Engineer.
Інтервʼю вийшло на позицію Junior Strong, а не мідл, але учасниця впоралась чудово!
До слова, Анастасія зараз в пошуках роботи і можна їй написати в Linkedin.
0:00 - Вступ, представлення Анастасії
0:07 - Опис вакансії ML-інженера та основні вимоги
1:00 - Початок інтерв’ю: досвід Анастасії у машинному навчанні
1:45 - Розповідь Анастасії про свій досвід з ML
2:27 - Запитання про досвід в NLP
3:49 - Завдання з пошуку дублікатів питань: підхід та рішення
5:00 - Аналіз даних: балансування класів, препроцесинг тексту
7:45 - Векторизація текстів: TF-IDF, Bag-of-Words, порівняння методів
10:30 - Використання класичних ML-моделей: Naïve Bayes, логістична регресія, XGBoost
11:50 - Оцінка точності моделі
14:14 - Чи можна в бінарній класифікації використовувати функцію гіпотези як в лінійній регресії?
15:52 - Чому Баєс - наїний
17:10 - Лосс-функція логістичної регресії: крос-ентропія
18:31 - Порівняння метрик класифікації: F1-score, accuracy, recall, precision
19:22 - Чому accuracy не завжди підходить для незбалансованих даних
20:47 - Використання ROC-AUC у задачах класифікації
22:02 - Перехід до рішення задачі з deep learning: використання моделі BERT
25:07 - Чим особливі контекстні ембеддинги BERT
28:44 - Деплоймент моделей машинного навчання: API, Docker, серверна інфраструктура
30:00 - Побудова сервісу для пошуку дублікатів у продакшені при надходженні нового питання
31:38 - Як відкинути зовсім непасуючі речення з аналізу
34:37 - База даних для збереження векторів
39:03 - Задача: чатбот на базі LLM, який враховує великий обʼєм користувацьких даних
44:00 - Розвʼязок задач на SQL online
49:03 - Питання на Python
53:22 - Секція фідбеку
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: