Fine-tune PaliGemma for image to JSON use cases

Автор: Niels Rogge

Загружено: 2024-05-30

Просмотров: 9766

Описание:

In this tutorial, I'll showcase how to fine-tune PaliGemma, a new open vision-language model by Google on a receipt image to JSON use case. The goal for the model is to learn to output a JSON containing all key fields from a receipt, such as the product items, their prices and quantities.

Do note that PaliGemma is just one of many vision-language models released recently.

The notebook can be found here: https://github.com/NielsRogge/Transfo...

Fine-tune PaliGemma for image to JSON use cases

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Подробное объяснение тонкой настройки LoRA и QLoRA

Подробное объяснение тонкой настройки LoRA и QLoRA

«Я хочу, чтобы Llama3 работала в 10 раз лучше, используя мои личные знания» — Local Agentic RAG с...

«Я хочу, чтобы Llama3 работала в 10 раз лучше, используя мои личные знания» — Local Agentic RAG с...

Объяснение LoRA (и немного о точности и квантизации)

Объяснение LoRA (и немного о точности и квантизации)

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

What are AI agents really? An illustration with Tiny Agents

What are AI agents really? An illustration with Tiny Agents

Как пользоваться Claude? Гайд с нуля до результата

Как пользоваться Claude? Гайд с нуля до результата

PaliGemma by Google: Train Model on Custom Detection Dataset

PaliGemma by Google: Train Model on Custom Detection Dataset

How a Transformer works at inference vs training time

How a Transformer works at inference vs training time

Fine-tuning Large Language Models (LLMs) | w/ Example Code

Fine-tuning Large Language Models (LLMs) | w/ Example Code

Creating your own ChatGPT: Supervised fine-tuning (SFT)

Creating your own ChatGPT: Supervised fine-tuning (SFT)

OpenAI, Google, Apple: кто реально победит в гонке AI

OpenAI, Google, Apple: кто реально победит в гонке AI

Тонкая настройка Llama2 7B на персональных наборах данных с помощью IITian | Проект ML/LLM

Тонкая настройка Llama2 7B на персональных наборах данных с помощью IITian | Проект ML/LLM

18 КРУТЫХ способов для ChatGPT (что кажется нелегально)

18 КРУТЫХ способов для ChatGPT (что кажется нелегально)

Что стоит за событиями в Иране: экономика, этнос, внешние факторы | Каринэ Геворгян & Стив Дудник

Что стоит за событиями в Иране: экономика, этнос, внешние факторы | Каринэ Геворгян & Стив Дудник

Почему Трамп в последний момент отменил удар по Ирану

Почему Трамп в последний момент отменил удар по Ирану

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

NotebookLM: большой разбор инструмента (12 сценариев применения)

NotebookLM: большой разбор инструмента (12 сценариев применения)

Training and deploying open-source large language models

Training and deploying open-source large language models

EASIEST Way to Fine-Tune a LLM and Use It With Ollama

EASIEST Way to Fine-Tune a LLM and Use It With Ollama