Обработка больших данных при помощи Apache Spark, часть 1

Автор: VK Team

Загружено: 2017-06-15

Просмотров: 22309

Описание:

Moscow Data Science Junior Meetup, 10 июня 2017.
Выступает Виталий Худобахшов (Одноклассники).

Apache Spark сегодня одна из самых популярных технологий обработки больших данных — в первую очередь за счёт очень удобного API, который близок к обычному функциональному стилю программирования на Scala. Виталий расскажет, что такое Spark и как с ним работать. Рассмотрит некоторые паттерны использования Spark. И, конечно, расскажет, что такое большие данные с практической точки зрения. В качестве основных примеров разберёт, как определить пол и возраст пользователя в социальной сети, если он указан с ошибкой. На этих примерах станет понятно, что можно узнать просто с помощью правильной обработки данных, даже не используя машинное обучение.

Календарь событий: https://team.vk.company/events/

VK Team — это миллион возможностей проявить себя. Мы делаем современные и быстрые интернет-сервисы, доступные каждому. На этом канале делимся опытом компании VK, рассказываем о технологиях, наших образовательных проектах и жизни команды.

😎 Сообщество ВКонтакте: https://vk.com/vkteam
👨‍🎓 VK Образование: https://education.vk.company
🏆 Чемпионаты: https://cups.online/
👨‍💻 Карьера в VK: https://team.vk.company/

Обработка больших данных при помощи Apache Spark, часть 1

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Обработка больших данных при помощи Apache Spark ч2 | Технострим

Обработка больших данных при помощи Apache Spark ч2 | Технострим

МИТАП "Apache Spark за 2 часа - для нетерпеливых"_20 апреля 2022г

ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ

ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

Полный разбор БЕЛЫХ СПИСКОВ. Как мы будем выживать в 2026

Полный разбор БЕЛЫХ СПИСКОВ. Как мы будем выживать в 2026

Apache Flink: Новое поколение потоковой обработки данных | Meta/conf

Apache Flink: Новое поколение потоковой обработки данных | Meta/conf

Эффективное использование Jupyter и PySpark на Hadoop для анализа больших данных| Технострим

Эффективное использование Jupyter и PySpark на Hadoop для анализа больших данных| Технострим

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

Что такое Apache Airflow - Курсы

Что такое Apache Airflow - Курсы "Школы Больших Данных" г. Москва

Как подключить к Apache Spark проприетарный источник данных / Александра Белоусова (Яндекс.Go)

Как подключить к Apache Spark проприетарный источник данных / Александра Белоусова (Яндекс.Go)

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

Евгений Борисов — Мифы о Spark, или Может ли пользоваться Spark обычный Java-разработчик

015. Apache Spark - Егор Пахомов

015. Apache Spark - Егор Пахомов

Автоматический подбор параметров для Spark-приложений / Валерия Дымбицкая (OneFactor)

Автоматический подбор параметров для Spark-приложений / Валерия Дымбицкая (OneFactor)

Поднимаем Hadoop-кластер локально | Скринкасты | ОК #1

Поднимаем Hadoop-кластер локально | Скринкасты | ОК #1

Лекция 4, Виктор Бородаенко, Основы Hadoop, современные подходы к обработке Big data

Лекция 4, Виктор Бородаенко, Основы Hadoop, современные подходы к обработке Big data

DATALEARN | DE - 101 | МОДУЛЬ 7-2 ЧТО ТАКОЕ APACHE SPARK

DATALEARN | DE - 101 | МОДУЛЬ 7-2 ЧТО ТАКОЕ APACHE SPARK

Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)

Пайплайн машинного обучения на Apache Spark / Павел Клеменков (Rambler&Co)

Что такое Apache Spark

Что такое Apache Spark

PySpark - как делать бигдэйту, не вылезая из ноутбучика – Евгений Глотов

PySpark - как делать бигдэйту, не вылезая из ноутбучика – Евгений Глотов

Технология MapReduce. Spark

Технология MapReduce. Spark