Промт - характер и Gimini боты экономят Время Как заставить ИИ видеть реальность, а не фантазировать
Автор: Творчество Comfy Ui
Загружено: 2026-01-05
Просмотров: 267
Быстрое изготовление карточек на Wildberries , ОЗОН и Яндекс Маркет и Нейрофотосессий - https://t.me/AiHeartYouTube
1. Что это вообще за промт
Это мета-промт (System Instruction) — инструкция системного уровня, а не обычный пользовательский запрос.
Он перепрошивает поведение модели, превращая её из «ассистента, который объясняет» в:
движок компьютерного зрения + сериализации данных
Модель начинает работать как парсер реальности, а не как рассказчик.
2. Роль (ROLE & OBJECTIVE)
You are VisionStruct, an advanced Computer Vision & Data Serialization Engine
Что происходит:
Модели запрещено быть ChatGPT в привычном виде
Ей навязывается жёсткая роль:
не интерпретировать
не оценивать
не упрощать
не «описывать красиво»
Модель должна транскодировать изображение → JSON, как если бы она была:
OCR
CV-алгоритмом
датасет-генератором в одном лице.
3. CORE DIRECTIVE — самый важный блок
Do not summarize.
You must capture 100% of the visual data.
If a detail exists in pixels, it must exist in JSON.
Это ломает стандартное поведение модели:
Обычная модель
С этим промтом
Обобщает
Детализирует
Пропускает мелочи
Фиксирует пиксели
«На фото человек»
Описывает складки ткани, пыль, блики
Думает «это неважно»
Ничего не считает неважным
Фраза «If a detail exists in pixels» — ключевая
Она заставляет модель:
мысленно «приближать» изображение
анализировать шум, текстуры, дефекты
описывать даже то, что обычно игнорируется
4. ANALYSIS PROTOCOL — скрытая логика мышления
perform a silent "Visual Sweep"
(do not output this)
Это очень важно
Ты разрешаешь модели думать поэтапно, но:
запрещаешь показывать chain-of-thought
оставляешь только результат
Три уровня анализа:
Macro Sweep
Глобальный контекст:
тип сцены
освещение
атмосфера
основные объекты
Micro Sweep
Пиксельный уровень:
текстуры
царапины
пыль
отражения
градиенты теней
мелкий текст (OCR)
Relationship Sweep
Семантика сцены:
кто что держит
кто кого перекрывает
откуда падает тень
визуальные и логические связи
Это имитация настоящего computer vision pipeline.
5. OUTPUT FORMAT — почему модель не может «съехать»
You must return ONLY a single valid JSON object.
Что это даёт:
нельзя добавить пояснение
нельзя написать «Вот JSON:»
нельзя использовать markdown
только чистые данные
Модель вынуждена подчиняться схеме, иначе ответ считается неправильным.
6. Почему схема такая большая
Каждый блок решает конкретную задачу
meta
Технические характеристики источника
→ полезно для датасетов, ML, фильтрации
global_context
Контекст сцены
→ заменяет «человеческое понимание» формализованным описанием
color_palette
Важно для:
генерации
matching
анализа визуального стиля
composition
Киноязык → формализованный
(ракурс, глубина резкости, фокус)
objects[]
Сердце промта
Каждый объект = отдельная сущность
Даже:
пыль
отражение
мелкий предмет на фоне
Это делает JSON **пригодным для:
обучения моделей
reverse-prompting
реконструкции сцены
автоматической генерации промтов**
micro_details
Самый «жёсткий» блок
Он насильно вытаскивает то, что модель обычно опускает
7. CRITICAL CONSTRAINTS — защита от халтуры
Примеры ограничений:
Never say "a crowd of people"
→ модель должна:
либо описать группу
либо декомпозировать её на элементы
Null Values must be explicit
→ JSON всегда:
валидный
предсказуемый
машиночитаемый
8. Зачем нужен такой промт на практике
Реальные применения:
Vision → Prompt (обратная генерация)
Создание датасетов для CV / ML
Анализ кадров фильмов
Контроль галлюцинаций
Точное воспроизведение сцен
Промт-инжиниринг высокого уровня
Подготовка входных данных для ComfyUI / Flux / SD
9. Почему он так хорошо работает именно с Gemini Gems / System Instructions
Потому что:
это жёсткая роль, а не просьба
структура не оставляет свободы интерпретации
модель «боится» нарушить формат
Gemini хорошо подчиняется строгим схемам
https://drive.google.com/file/d/1PkIc... - Промт характер картинки или фото
https://t.me/AdSenseRussia - Американский ADSense под 45% (30% это налог в США, 15% это наша комиссия) возможен договор на создание контента или продюсирование канала
https://pay.cloudtips.ru/p/eea700bd - поддержка канала для мотивации
#ai #artificialintelligence #chatgpt #gemini #computervision #promptengineering #systemprompt #metaprompt #aivision #imageanalysis #json #structureddata #machinelearning #neuralnetworks #aitools #aieducation #futuretech
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: