Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Подготовка набора данных для тонкой настройки Donut (часть 1, Document AI)

Автор: Andrej Baranovskij

Загружено: 2023-01-30

Просмотров: 7993

Описание:

Я расскажу о наборе данных, который буду использовать для тонкой настройки модели Donut. Покажу, как PDF-файлы преобразуются в файлы изображений для дальнейшей обработки и извлечения данных OCR. На следующем этапе данные JSON преобразуются в формат, понятный инструменту обработки/просмотра аннотаций Sparrow.

Sparrow — извлечение данных из документов с помощью машинного обучения:
https://github.com/katanaml/sparrow

0:00 Введение
0:37 Репозиторий GitHub
1:23 Набор данных
4:15 OCR
7:30 Преобразование
9:05 Краткое содержание

ПОДКЛЮЧИТЬСЯ:
Подписаться на этот канал на YouTube
Twitter:   / andrejusb  
LinkedIn:   / andrej-baranovskij  
Medium:   / andrejusb  

#machinelearning #python #data

Подготовка набора данных для тонкой настройки Donut (часть 1, Document AI)

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Подготовка набора данных для тонкой настройки Donut (часть 2, Document AI)

Подготовка набора данных для тонкой настройки Donut (часть 2, Document AI)

Preparing Dataset for Donut Fine-Tuning (part 3, Document AI)

Preparing Dataset for Donut Fine-Tuning (part 3, Document AI)

СОЗДАВАЙТЕ НАБОРЫ ДАННЫХ И НАСТРОЙТЕ LLM БЕСПЛАТНО! — Наборы данных из PDF-файлов (бесплатный ИИ-...

СОЗДАВАЙТЕ НАБОРЫ ДАННЫХ И НАСТРОЙТЕ LLM БЕСПЛАТНО! — Наборы данных из PDF-файлов (бесплатный ИИ-...

«Я хочу, чтобы Llama3 работала в 10 раз лучше, используя мои личные знания» — Local Agentic RAG с...

«Я хочу, чтобы Llama3 работала в 10 раз лучше, используя мои личные знания» — Local Agentic RAG с...

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

Новое расширение Claude для Chrome: секретное оружие, которое должен использовать каждый

Donut 🍩: Transformer для понимания документов без OCR (обзор исследовательской работы)

Donut 🍩: Transformer для понимания документов без OCR (обзор исследовательской работы)

Тонкая настройка модели Qwen2 VL с помощью Llama Factory

Тонкая настройка модели Qwen2 VL с помощью Llama Factory

Fine-tuning Large Language Models (LLMs) | w/ Example Code

Fine-tuning Large Language Models (LLMs) | w/ Example Code

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Кто пишет код лучше всех? Сравнил GPT‑5.2, Opus 4.5, Sonnet 4.5, Gemini 3, Qwen 3 Max, Kimi, GLM

Структурированный поиск данных с помощью Sparrow с использованием OCR и Vision LLM [Повышенная то...

Структурированный поиск данных с помощью Sparrow с использованием OCR и Vision LLM [Повышенная то...

Donut 🍩 — ChatGPT для ИИ-документов

Donut 🍩 — ChatGPT для ИИ-документов

How to Extract Financial Statement Data with Sparrow & Vision LLM

How to Extract Financial Statement Data with Sparrow & Vision LLM

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Сисадмины больше не нужны? Gemini настраивает Linux сервер и устанавливает cтек N8N. ЭТО ЗАКОННО?

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Самая быстрая передача файлов МЕЖДУ ВСЕМИ ТИПАМИ УСТРОЙСТВ 🚀

Самая быстрая передача файлов МЕЖДУ ВСЕМИ ТИПАМИ УСТРОЙСТВ 🚀

Mindee docTR — вероятно, лучший OCR с открытым исходным кодом

Mindee docTR — вероятно, лучший OCR с открытым исходным кодом

ЖЕСТЬ в Запорожье: ВСУ попали в ОКРУЖЕНИЕ ⚔️ Карта Боевых действий на 16.01.2026

ЖЕСТЬ в Запорожье: ВСУ попали в ОКРУЖЕНИЕ ⚔️ Карта Боевых действий на 16.01.2026

«Хорошо, но мне нужна Llama 3 для моего конкретного случая использования» — вот как

«Хорошо, но мне нужна Llama 3 для моего конкретного случая использования» — вот как

Как настроить модель Donut (Document AI)

Как настроить модель Donut (Document AI)

Richard Feynman: Can Machines Think?

Richard Feynman: Can Machines Think?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com