Подготовка набора данных для тонкой настройки Donut (часть 2, Document AI)
Автор: Andrej Baranovskij
Загружено: 2023-02-05
Просмотров: 4489
Я объясняю, как группировать результаты распознавания текста (OCR) в один объект с помощью инструмента аннотаций Sparrow. Это полезно для таких полей, как адрес и описание товара, когда текст поля состоит из нескольких слов.
Sparrow — извлечение данных из документов с помощью машинного обучения:
https://github.com/katanaml/sparrow
0:00 Введение
0:17 Преобразование данных
5:16 Группировка результатов распознавания текста (OCR)
9:56 Демонстрация
14:00 Краткое содержание
ПОДКЛЮЧИТЬСЯ:
Подписаться на этот канал на YouTube
Twitter: / andrejusb
LinkedIn: / andrej-baranovskij
Medium: / andrejusb
#machinelearning #python #data
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: