Классификация изображений документов с помощью LayoutLM | Понимание документов |
Автор: Karndeep Singh
Загружено: 2022-04-29
Просмотров: 17678
Документы в формате PDF или изображений доступны в финансовой сфере, сфере товаров повседневного спроса, здравоохранении и т. д. Когда документов много, их становится сложно классифицировать по определённой категории, поскольку документы различаются не только по шаблонам изображений, но и по текстовому контексту. Таким образом, объединение изображений и текста в единую модель и их классификация по нужной категории делает этот подход более функциональным и целесообразным для создания качественной модели классификатора, чем простая настройка простых классификаторов изображений, таких как VGG, ResNet и т. д.
В видео объясняется тонкая настройка модели LayoutLm для обучения на пользовательском наборе данных с использованием информации об изображениях и тексте для классификации документа по нужной категории.
✅ Инструмент для аннотаций LayoutLM: • Annotate Text, PDF & Image Documents for L...
✅ Зарегистрироваться в инструменте для аннотаций: https://ubiai.tools/Signup?utm_source...
1. Блокнот: https://github.com/karndeepsingh/Extr...
2. Студия этикеток: https://labelstud.io/blog/Improve-OCR...
3. Бумага LayoutLMv2: https://arxiv.org/abs/2012.14740v4
4. Набор данных FUNSD: https://guillaumejaume.github.io/FUNSD/
5. https://github.com/NielsRogge/Transfo...
6. Файл предварительной обработки LayoutLM: https://github.com/UBIAI/layout_lm_tu...
7. https://github.com/katanaml/sparrow
Свяжитесь со мной:
1. LinkedIn: / karndeepsingh
2. Группа в Telegram: https://telegram.me/datascienceclubac...
3. Github: https://www.github.com/karndeepsingh
#datascience #nlp #deeplearning #documentunderstanding
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: