Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Johannes Kolbe - More Than Pixels - Unlock your image data with Vision-Language Models - SPS24

Автор: Swiss Python Summit

Загружено: 2024-11-11

Просмотров: 39

Описание:

Talk recorded at the Swiss Python Summit on October 18th, 2024.

Licensed as Creative Commons Attribution 4.0 International.

---------
Abstract:

Join us on two Vision-Language Adventures!

We'll uncover the information hidden inside big image collections with Vision-Language Models (VLMs) showing us the way. Who knows which forgotten gems await us?

In the first part, we'll use CLIP and FAISS to go on a treasure hunt in your photo collection. You'll learn how to filter through millions of images in a breeze, using natural language. Bye-bye endless scrolling, hour-long tagging, and frustrated folder searching 👋

In the second part, we will harness the power of VLMs to help us caption images - translating pixels to words. Then we'll make use of the BERTopic library to reveal even deeper insights into your photo collections.

By the end of this talk, you'll be equipped with the knowledge and tools to unlock new insights, identify patterns, and make your image data work harder for you.

This talk is for an intermediate audience - it is good if you bring some knowledge in Computer Vision, NLP or just general Deep Learning.

The talk will be structured as follows:
5min - What are VLMs?
10min - Image Search with CLIP and FAISS
10min - Analysis of Captioned Images
5min - Possible Applications, Closing Thoughts

---------------------
About the speaker(s):

Hey all 👋

I'm a Data Scientist at celebrate company by day and an AI storyteller by night.

After experiences in research at Fraunhofer Fokus Institute and tinkering with sensor setups for autonomous vehicles, I decided to get more hands-on and joined celebrate company, where I'm now helping our customers to design amazing products with the help of Machine Learning.

I hold a Master's degree in Computer Science with a focus on cognitive systems from TU Berlin.

Johannes Kolbe - More Than Pixels - Unlock your image data with Vision-Language Models - SPS24

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Jan Werth, Christopher Wetekamp - We do not always need Deep Learning - SPS24

Jan Werth, Christopher Wetekamp - We do not always need Deep Learning - SPS24

Почему взрываются батарейки и аккумуляторы? [Veritasium]

Почему взрываются батарейки и аккумуляторы? [Veritasium]

AI в руках AQA: LLM, промтоинженеринг и практические техники для автотестов

AI в руках AQA: LLM, промтоинженеринг и практические техники для автотестов

Как работает трассировка лучей в видеоиграх и фильмах?

Как работает трассировка лучей в видеоиграх и фильмах?

Albert Weichselbraun - Artificial Intelligence: Why Explanations Matter - SPS24

Albert Weichselbraun - Artificial Intelligence: Why Explanations Matter - SPS24

Calming Meditation | 1 hour handpan music | Malte Marten

Calming Meditation | 1 hour handpan music | Malte Marten

Мессенджер Max - это аналог китайского WeChat. Но самом деле это не так

Мессенджер Max - это аналог китайского WeChat. Но самом деле это не так

Daniel Szoke - Why you, as a Python developer, should learn Rust - SPS25

Daniel Szoke - Why you, as a Python developer, should learn Rust - SPS25

Предел развития НЕЙРОСЕТЕЙ

Предел развития НЕЙРОСЕТЕЙ

GEMINI 3 от GOOGLE САМЫЙ ДОЛГОЖДАННЫЙ ВЫПУСК ГОДА

GEMINI 3 от GOOGLE САМЫЙ ДОЛГОЖДАННЫЙ ВЫПУСК ГОДА

Как работает ChatGPT: объясняем нейросети просто

Как работает ChatGPT: объясняем нейросети просто

Топ технологий 2025г. Выставка автомобилей в г.Гуанчжоу.

Топ технологий 2025г. Выставка автомобилей в г.Гуанчжоу.

Как работает космический телескоп? (Хаббл и Уэбб)

Как работает космический телескоп? (Хаббл и Уэбб)

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

Как LLM могут хранить факты | Глава 7, Глубокое обучение

Как LLM могут хранить факты | Глава 7, Глубокое обучение

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Понимание GD&T

Понимание GD&T

БЕЛКОВСКИЙ:

БЕЛКОВСКИЙ: "В Кремле проговорились". Кошмар Путина, что с "Мирным планом", что у Трампа, Китай,Маск

This graph will change how you see the world

This graph will change how you see the world

Изучите Microsoft Active Directory (ADDS) за 30 минут

Изучите Microsoft Active Directory (ADDS) за 30 минут

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]