Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Is GPL the Future of Sentence Transformers? | Generative Pseudo-Labeling Deep Dive

Автор: James Briggs

Загружено: 2022-03-30

Просмотров: 8797

Описание:

🎁 Free NLP for Semantic Search Course:
https://www.pinecone.io/learn/nlp

Training sentence transformers is hard; they need vast amounts of labeled data. On one hand, the internet is full of data, and, on the other, this data is not in the format we need. We usually need to use a supervised training method to train a high-performance bi-encoder (sentence transformer) model.

There is research producing techniques placing us ever closer to fine-tuning high-perfomance bi-encoder models with unlabeled text data. One of the most promising is GPL. At its core, GPL allows us to take unstructured text data and use it to build models that can understand this text. These models can then intelligently respond to natural language queries regarding this same text data.

It is a fascinating approach, with massive potential across innumerous use cases spanning all industries and borders. With that in mind, let's dive into the details of GPL and how we can implement it to build high-performance LMs with nothing more than plain text.

🌲 Pinecone article:
https://www.pinecone.io/learn/gpl/

🔗 Notebooks:
https://github.com/pinecone-io/exampl...

🤖 70% Discount on the NLP With Transformers in Python course:
https://bit.ly/3DFvvY5

🎉 Subscribe for Article and Video Updates!
  / subscribe  
  / membership  

👾 Discord:
  / discord  

00:00 Intro
01:08 Semantic Web and Other Uses
04:36 Why GPL?
07:31 How GPL Works
10:37 Query Generation
12:08 CORD-19 Dataset and Download
13:27 Query Generation Code
21:53 Query Generation is Not Perfect
22:39 Negative Mining
26:28 Negative Mining Implementation
27:21 Negative Mining Code
35:19 Pseudo-Labeling
35:55 Pseudo-Labeling Code
37:01 Importance of Pseudo-Labeling
41:20 Margin MSE Loss
43:40 MarginMSE Fine-tune Code
46:30 Choosing Number of Steps
48:54 Fast Evaluation
51:43 What's Next for Sentence Transformers?

Is GPL the Future of Sentence Transformers? | Generative Pseudo-Labeling Deep Dive

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Что с Кадыровым, Иран: разгром протеста, Суд над Тимошенко. Крутихин, Фейгин, Айсин

Что с Кадыровым, Иран: разгром протеста, Суд над Тимошенко. Крутихин, Фейгин, Айсин

SPLADE: the first search model to beat BM25

SPLADE: the first search model to beat BM25

BERTopic Explained

BERTopic Explained

3 Vector-based Methods for Similarity Search (TF-IDF, BM25, SBERT)

3 Vector-based Methods for Similarity Search (TF-IDF, BM25, SBERT)

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Трамп-эгоист. Как США за это заплатят?

Трамп-эгоист. Как США за это заплатят?

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

Что такое Rest API (http)? Soap? GraphQL? Websockets? RPC (gRPC, tRPC). Клиент - сервер. Вся теория

The Man Behind Google's AI Machine | Demis Hassabis Interview

The Man Behind Google's AI Machine | Demis Hassabis Interview

ВСЯ ПРАВДА ПРО ТЕЛЕВИЗОРЫ В 2026 году: OLED, MiniLED, бренды, цены, технологии

ВСЯ ПРАВДА ПРО ТЕЛЕВИЗОРЫ В 2026 году: OLED, MiniLED, бренды, цены, технологии

This is why I believe that the future already exists

This is why I believe that the future already exists

Запуск нейросетей локально. Генерируем - ВСЁ

Запуск нейросетей локально. Генерируем - ВСЁ

Introduction - Recent Developments in Neural Search

Introduction - Recent Developments in Neural Search

I Read Honey's Source Code

I Read Honey's Source Code

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

ЗАЧЕМ ТРАМПУ ГРЕНЛАНДИЯ? / Уроки истории @MINAEVLIVE

ЗАЧЕМ ТРАМПУ ГРЕНЛАНДИЯ? / Уроки истории @MINAEVLIVE

Faiss - Introduction to Similarity Search

Faiss - Introduction to Similarity Search

Searching Freely: Using GPL for Semantic Search ft. Nils Reimers

Searching Freely: Using GPL for Semantic Search ft. Nils Reimers

Fine-tune High Performance Sentence Transformers (with Multiple Negatives Ranking)

Fine-tune High Performance Sentence Transformers (with Multiple Negatives Ranking)

What is Semi-Supervised Learning?

What is Semi-Supervised Learning?

Domain Adaptation for Dense Information Retrieval

Domain Adaptation for Dense Information Retrieval

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com