相关性03:文本匹配(TF-IDF、BM25、词距)
Автор: Shusen Wang
Загружено: 12 мая 2024 г.
Просмотров: 1 628 просмотров
这节课的内容是传统的相关性方法。在BERT等深度学习技术成熟之前,这类方法很流行;目前这类方法正在逐渐被淘汰,仅用于召回海选和粗排。这类方法用人工设计的特征,包括TF-IDF、BM25、词距、核心词匹配等文本匹配分数,然后把几十种分数作为特征输入线性模型或GBDT模型,模型输出查询词和文档的相关性。
课件地址:
https://github.com/wangshusen/SearchE...

Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: