Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Simple Unsupervised Keyphrase Extraction using Sentence Embeddings (Research Paper Walkthrough)

Автор: TechViz - The Data Science Guy

Загружено: 2020-07-29

Просмотров: 7696

Описание:

#naturallanguageprocessing #researchpaperwalkthrough #datascience #keywordextraction
Keywords/Keyphrase extraction is the task of extracting relevant and representative words that best describe the underlying document

⏩ Abstract : Keyphrase extraction is the task of automatically selecting a small set of phrases that best describe a given free text document. Supervised keyphrase extraction requires large amounts of labeled training data and generalizes very poorly outside the domain of the training data. At the same time, unsupervised systems have poor accuracy, and often do not generalize well, as they require the input document to belong to a larger corpus also given as input. Addressing these drawbacks, in this paper, we tackle keyphrase extraction from single documents with EmbedRank: a novel unsupervised method, that leverages sentence embeddings. EmbedRank achieves higher F-scores than graph-based state of the art systems on standard datasets and is suitable for real-time processing of large amounts of Web data. With EmbedRank, we also explicitly increase coverage and diversity among the selected keyphrases by introducing an embedding-based maximal marginal relevance (MMR) for new phrases. A user study including over 200 votes showed that, although reducing the phrases' semantic overlap leads to no gains in F-score, our high diversity selection is preferred by humans.

⏩ OUTLINE:
0:00 - Intro & Overview
4:15 - Diversity Problem in Keyphrase Extraction
6:03 - Main Algorithm
8:35 - Diagramatic Flow of Main Algorithm
10:02 - Maximal Marginal Relevance (MMR)
15:35 - Sentence Embedding Techniques - Doc2Vec and Sent2Vec
20:13 - My thoughts and takeaways on the paper

⏩ Paper: https://arxiv.org/abs/1801.04470
⏩ Authors: Kamil Bennani-Smires, Claudiu Musat, Andreea Hossmann, Michael Baeriswyl, Martin Jaggi
⏩ Organisation: Machine Learning and Optimization Laboratory, EPFL

⏩ IMPORTANT LINKS:
MMR (Maximal Margin Relevance) - http://www.cs.bilkent.edu.tr/~canf/CS...
Topic Rank (Keyword Extraction) - https://www.aclweb.org/anthology/I13-...
WordAttraction Rank (Keyword Extraction) - https://pdfs.semanticscholar.org/bd37...
TextRank (Keyword Extraction) - https://web.eecs.umich.edu/~mihalcea/...

Enjoy reading articles? then consider subscribing to Medium membership, it just 5$ a month for unlimited access to all free/paid content. Subscribe now -   / membership  

*********************************************
If you want to support me financially which totally optional and voluntary :) ❤️
You can consider buying me chai ( because i don't drink coffee :) ) at https://www.buymeacoffee.com/TechvizC...

*********************************************
⏩ Youtube -    / @techvizthedatascienceguy  
⏩ Blog - https://prakhartechviz.blogspot.com
⏩ LinkedIn -   / prakhar21  
⏩ Medium -   / prakhar.mishra  
⏩ GitHub - https://github.com/prakhar21
*********************************************

Please feel free to share out the content and subscribe to my channel :)

⏩ Subscribe -    / @techvizthedatascienceguy  

Tools I use for making videos :)
⏩ iPad - https://tinyurl.com/y39p6pwc
⏩ Apple Pencil - https://tinyurl.com/y5rk8txn
⏩ GoodNotes - https://tinyurl.com/y627cfsa

#techviz #datascienceguy #machinelearning #wordembeddings

Simple Unsupervised Keyphrase Extraction using Sentence Embeddings (Research Paper Walkthrough)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

DialoGPT: Generative Training for Conversational Response Generation (Research Paper Walkthrough)

DialoGPT: Generative Training for Conversational Response Generation (Research Paper Walkthrough)

Formal Description of Prompting: Systematic Survey of Prompting Methods in NLP (P.1)

Formal Description of Prompting: Systematic Survey of Prompting Methods in NLP (P.1)

Unsupervised Multi-Document Summarization using Neural Document Model | Research Paper Walkthrough

Unsupervised Multi-Document Summarization using Neural Document Model | Research Paper Walkthrough

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Cybersecurity Trends in 2026: Shadow AI, Quantum & Deepfakes

Cybersecurity Trends in 2026: Shadow AI, Quantum & Deepfakes

Все начнется с 30 декабря по 2 января: появилось важное предупреждение для всех украинцев

Все начнется с 30 декабря по 2 января: появилось важное предупреждение для всех украинцев

Language Learning with BERT - TensorFlow and Deep Learning Singapore

Language Learning with BERT - TensorFlow and Deep Learning Singapore

⚡️ Удар по Верховной Раде? || Ответ за

⚡️ Удар по Верховной Раде? || Ответ за "покушение" на Путина

Арестович: Был ли удар по спецобъекту РФ? Зеленский играет против Трампа?

Арестович: Был ли удар по спецобъекту РФ? Зеленский играет против Трампа?

Переговоры, территория и будущее Украины: скрытая повестка. Дмитрий Евстафьев

Переговоры, территория и будущее Украины: скрытая повестка. Дмитрий Евстафьев

Миллиарды на ветер: Су-57 - главный авиационный миф России

Миллиарды на ветер: Су-57 - главный авиационный миф России

The Future of Natural Language Processing

The Future of Natural Language Processing

⚡АСЛАНЯН: СЕЙЧАС! СРОЧНЫЙ разговор Трампа и Путина. ОТВЕТ диктатора УДИВИЛ ВСЕХ. Вот что ЗРЕЕТ

⚡АСЛАНЯН: СЕЙЧАС! СРОЧНЫЙ разговор Трампа и Путина. ОТВЕТ диктатора УДИВИЛ ВСЕХ. Вот что ЗРЕЕТ

СРОЧНО! ПОРТНИКОВ:

СРОЧНО! ПОРТНИКОВ: "Это эскалация". Лавров заявил об атаке на Путина, что с Трампом, РФ готовит удар

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

КАК УСТРОЕН TCP/IP?

КАК УСТРОЕН TCP/IP?

Text Summarization of COVID-19 Medical Articles using BERT and GPT-2 (Research Paper Walkthrough)

Text Summarization of COVID-19 Medical Articles using BERT and GPT-2 (Research Paper Walkthrough)

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

ДНК создал Бог? Самые свежие научные данные о строении. Как работает информация для жизни организмов

Примет ли Россия сделку или это все блеф?

Примет ли Россия сделку или это все блеф?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]