Создавайте фото и видео генерации в одном месте

Здесь собраны лучшие нейросети в одном месте. Выбирайте любую модель - от самых быстрых и дешёвых до топовых по качеству.

Назад в блог

Генерация изображений в СhatGPT - инструкция с промтами

Время чтения - 10 мин
Автор статьи Пётр Васильев

Автор - Пётр Васильев

Разработчик ИИ-сервиса

Генерация изображений в ChatGPT

Нужна картинка для поста, а под рукой нет ни дизайнера, ни подходящего кадра на фотостоке, ни привычного фоторедактора. Раньше это означало часы поиска или ожидание, пока кто-то другой сделает изображение по вашему описанию. Сейчас хватает пары фраз. Откройте ChatGPT и напишите текстовый запрос: что должно быть на картинке, в каком стиле, с каким настроением. Модель считывает текст и превращает его в готовое фото за несколько секунд прямо в интерфейсе чата. Вот почему генерация изображений через СhatGPT стала одним из самых быстрых способов сделать визуал онлайн, без специальных программ.

Это работает не только для дизайнеров. Любой, кто умеет объяснить словами, что хочет увидеть, может использовать этот AI-инструмент, чтобы делать картинки, обложки или иллюстрации. Нужен только текст: описание сцены, стиля и деталей. Новые версии модели искусственного интеллекта этого года, на базе которых сейчас работает ChatGPT, справляются с этим заметно точнее прежних, а сама функция сегодня доступна большинству пользователей бесплатно и без сложной регистрации. Доступ к генерации в GPT Image 2 можно получит через Sovetnik AI.

Что вообще умеет ChatGPT с картинками

Генерация изображений звучит как одна функция, а на деле их три, и путать сценарии не стоит - от выбранного зависит, что писать в запросе.

  • Создание с нуля. Вы описываете сцену словами, и модель собирает изображение из этого описания, без какой-либо исходной картинки.
  • Работа по референсу. Вы загружаете своё фото или фото товара, а модель использует его как основу и достраивает вокруг новую сцену, сохраняя ключевые детали.
  • Редактирование готового изображения: убрать лишний предмет, поменять фон, сделать свет мягче. Здесь отправная точка - уже готовый кадр, а не пустой лист.

Разница между этими тремя сценариями примерно такая же, как между "нарисовать портрет по описанию", "дорисовать фон вокруг готовой фотографии" и "подретушировать снимок". Задача выглядит одинаково: это картинка. Но модель решает её по-разному, и это влияет на то, что вы пишете в запросе. Простота использования в том, что не приходится переключаться между разными инструментами ради этих трёх сценариев: всё происходит в одном чате.

Что можно создать через GPT Image 2 для изображений

По сути, это универсальный генератор изображений, который справляется сразу с несколькими направлениями. Диапазон задач здесь заметно шире, чем "нарисуй что-нибудь красивое".

  • Фотореалистичные изображения - портреты, предметная съемка, интерьеры, пейзажи. Модель ориентируется на массив настоящих фотографий, поэтому результат получается максимально близким к реальному кадру, если добавить в запрос слова вроде "фотореализм" и "естественный свет".
  • Дизайн и графика - логотипы, иконки, баннеры, элементы для сайта и рабочих проектов. Здесь важны не нюансы освещения, а чистота композиции: минимум лишних деталей, понятный стиль, чёткая структура.
  • Художественные изображения - акварель, масляная живопись, иллюстрация в анимационном, комиксном стиле или в жанре цифрового арта. В этом направлении модель работает свободнее, а точность деталей уступает по важности настроению и общему стилю.
  • Рабочий визуальный контент - инфографика, схемы, обложки презентаций, карточки с текстом. Для таких задач лучше заранее описать структуру: сколько блоков, где текст, где иконка. Иначе модель сама решит компоновку, и не всегда удачно.

Что из этого выбрать, зависит от задачи: современные модели достаточно мощные, чтобы закрыть любой из этих сценариев, но выбор всё равно определяет итоговый стиль. Для карточки товара нужен фотореализм и чистый фон, для обложки статьи - дизайн или иллюстрация, для визуала с идеей внутри - художественный стиль.

Как устроен рабочий запрос

Здесь легко ошибиться, если думать, что чем красивее фраза, тем лучше результат. На самом деле модель не понимает красоту слов, она понимает конкретику. Запрос "сделай красивую картинку для магазина" ничем не поможет: модель не знает, что именно должно быть в кадре, и додумывает это сама. Система читает не отдельные красивые слова, а структуру запроса целиком, поэтому порядок и конкретика важнее эпитетов. В отличие от инструментов с продвинутыми настройками вроде Midjourney, где нужно осваивать отдельный синтаксис команд, здесь достаточно обычного текста.

Работающий запрос обычно складывается из шести частей, которые идут одна за другой:

  • главный объект;
  • назначение картинки;
  • стиль;
  • композиция;
  • свет и фон;
  • ограничения - то, чего быть не должно.

Такая схема помогает получить изображение, которое соответствует задаче, с первой попытки, а не с пятой.

Возьмем тот же неудачный пример и пересобрать его по этой схеме: "Создай фото белых кроссовок на светлом фоне, для карточки товара в интернет-магазине, современный спортивный стиль, крупный план, мягкая тень и естественное освещение, без текста и лишних предметов". Каждая часть отвечает на свой вопрос: что, зачем, как выглядит, как расставлено, какой свет, чего избегать. Писать можно на русском или на любом другом языке - поддержка нескольких языков встроена по умолчанию, и модель одинаково хорошо понимает запрос в поле ввода независимо от того, на каком языке вы его сформулировали. Весь процесс укладывается в один текстовый диалог, без отдельных панелей настроек, и в этом, пожалуй, главное удобство.

Как сгенерировать картинку в СhatGPT с нуля

Когда картинки ещё нет и её нужно собрать полностью из текста, результат почти целиком зависит от условий, которые вы закладываете в первый запрос. Модели не с чем сверяться, кроме ваших слов, поэтому мелочи, которые кажутся неважными, на деле решают, получится кадр рабочим или случайным. Вот на что стоит обратить внимание.

  1. Порядок деталей. Модель обрабатывает запрос последовательно, и то, что стоит в начале предложения, чаще становится смысловым центром картинки. Опишете сначала фон, а объект добавите в конце - велик шанс получить кадр со смещенным акцентом. Начинайте с главного: что должно быть в кадре, а уже потом где это находится и как выглядит вокруг.
  2. Конкретность вместо объема. Длинный список эпитетов работает хуже, чем несколько точных деталей. "Красивый, стильный, современный интерьер" ничего не даёт модели, а "светлая гостиная, деревянный пол, большое окно с видом на улицу" - три конкретные зацепки, из которых складывается узнаваемая сцена. Если вы описываете картинку одними прилагательными без существительных, это повод спуститься на уровень конкретных деталей.
  3. Назначение картинки. "Для карточки товара" или "для обложки статьи" - не декоративная деталь, а инструкция по композиции: модель по-разному расставляет объект в кадре, если знает, что вокруг него нужно оставить место под текст или что фото пойдёт крупным планом в ленту соцсети.
  4. Формат заранее. Вертикальный кадр для сторис, широкий баннер для сайта, квадрат для карточки товара - если не указать это в первом запросе, модель выберет формат сама, и часто он не совпадает с тем, что нужно на самом деле.
  5. Черновик, а не финал. Не стоит ждать идеального результата с первой попытки. Генерация с нуля работает лучше как черновик, который потом дорабатывается уточнениями. Если сцена в целом верная, но что-то не так с деталями, разумнее поправить именно эти детали, чтобы достичь максимально близкого к задумке результата, а не переписывать весь запрос заново.

Как сгенерировать картинку по своему фото

Если у вас уже есть снимок, товар, человек, интерьер, и вы хотите не придумать новую картинку, а переработать существующую, схема немного другая. Такой подход позволяет сохранить то, что уже устраивает, и поменять только часть сцены.

Загрузите фото прямо в тот же диалог и опишите, что нужно сохранить, а что изменить. Ключевое слово здесь - "сохранить": если не указать это явно, модель может свободно интерпретировать исходник и потерять то, что было важно. Для товара это форма, цвет, логотип и надписи на упаковке. Для портрета - черты лица, форма глаз, цвет волос, естественные пропорции.

Дальше добавляете сцену: где теперь находится объект, какое освещение, какое настроение. Например: "Используй загруженное фото флакона как основу. Сохрани форму, цвет и надписи. Помести флакон на светлый мраморный стол, добавь мягкие тени и естественные блики, стиль рекламной предметной съёмки, без лишних предметов в кадре". Модель берёт исходное фото как опору и достраивает вокруг него новую сцену, а не переписывает объект с нуля.

Как довести результат до нужного вида

Первая картинка редко получается идеальной, и это нормально: вся сила ChatGPT в генерации изображений не в первом результате, а в том, что с ним можно разговаривать дальше и с помощью коротких уточнений постепенно прийти к нужному.

Вместо того чтобы переписывать весь запрос заново, проще дать короткую правку: "сделай фон светлее", "убери предмет справа", "сохрани композицию, но добавь больше реализма", "сделай свет мягче и теплее". Такие команды модель воспринимает как продолжение того же диалога, а не как новую задачу. Каждая правка сужает разрыв между тем, что получилось, и тем, что вы себе представляли, и обычно после двух-трёх уточнений результат становится рабочим. Иногда проще сразу попросить несколько вариантов одной сцены и выбрать лучший, чем долго шлифовать один.

Промты под задачи маркетолога

Раз уж вся механика понятна, дальше проще один раз посмотреть на готовые примеры для задач бизнеса и адаптировать их под себя - такие заготовки выручают в любой рабочий день, а не только в горящих проектах.

  • Карточка товара: "Создай предметное фото товара на светлом фоне, объект в центре, мягкая тень, реалистичные материалы, чистая композиция, стиль интернет-магазина, без лишних предметов".
  • Рекламный баннер: "Создай рекламный баннер для распродажи: яркий, но не перегруженный фон, место для короткого текста слева, современный стиль, теплая цветовая гамма, горизонтальный формат".
  • Обложка статьи: "Создай обложку для статьи про нейросети: человек работает за ноутбуком, вокруг простые абстрактные элементы, светлый фон, современный стиль, место под заголовок сверху".
  • Портрет специалиста: "Создай реалистичный деловой портрет: человек смотрит в камеру, мягкий дневной свет, нейтральный фон, естественная улыбка, аккуратная, но не чрезмерная обработка".

Каждый из этих запросов держится на той же схеме: объект, назначение, стиль, свет, ограничения. Меняется только содержание и канал, для которого готовится картинка.

Как создать реалистичное изображение в СhatGPT

Разница между картинкой, которая явно сделана нейросетью, и фото, которое не отличить от настоящего, обычно не в самой модели, а в том, что написано в запросе. Вот несколько советов, которые чаще всего решают эту разницу.

  1. Прямое указание на реализм. "Фотореализм", "снято на камеру", "реальные пропорции" звучат как формальность, но модель действительно воспринимает такие фразы как сигнал держаться ближе к настоящим фотографиям, а не к более условным, "нарисованным" изображениям.
  2. Свет. "Мягкий дневной свет", "естественное освещение из окна", "теплый вечерний свет" работают лучше, чем просто "хорошее освещение", потому что дают модели конкретный источник и направление, а не абстрактную оценку.
  3. Детали на уровне текстуры. Лёгкое размытие фона, естественные тени, текстура кожи или ткани, небольшие несовершенства вместо идеальной гладкости - то, что выдает настоящую съемку. Идеально ровная кожа или симметричная до миллиметра композиция, наоборот, чаще всего выдают нейросеть.
  4. Тип съёмки или объектив - необязательно, но полезно. "Портретный объектив", "малая глубина резкости", "эффект боке" модель воспринимает как указание на визуальный стиль кадра, а не как техническое требование. Разбираться в фототехнике не нужно, а результат получается ближе к профессиональному, качественному кадру.

Если результат всё равно выглядит слишком гладким или нарисованным, можно прямо попросить модель снизить это ощущение: "сделай более натурально", "убери глянец", "добавь естественных несовершенств". Такая правка часто работает лучше, чем попытка переписать весь запрос заново.

Частые ошибки новичков

Новичков в промтах обычно подводят одни и те же вещи.

  • Слишком общий запрос. "Сделай красивое фото" почти всегда даёт случайный результат, потому что модель не знает, что именно вы считаете красивым.
  • Противоречия внутри одного запроса. "Реалистичное фото в стиле мультфильма" ставит перед моделью задачу без однозначного решения, и результат получается чем-то средним между двумя направлениями.
  • Слишком большое количество объектов сразу. Десять предметов, сложный фон и длинная надпись в одном запросе почти гарантированно превращаются в перегруженную картинку. Проще начать с одного главного объекта и добавлять детали по ходу уточнений.
  • Отсутствие ограничений. Если вы не хотите текст на изображении, лишних людей в кадре или яркие цвета, это стоит написать прямо. Модель одинаково хорошо реагирует и на то, что нужно получить, и на то, чего быть не должно.
Попробовать Sovetnik AI

Промты на разные случаи

Иногда проще не собирать запрос с нуля, а взять рабочую заготовку и подставить свои детали - такой подход экономит время в любых рабочих проектах. Вот набор промтов под самые частые задачи, а выбор конкретной формулировки всегда можно скорректировать под свою сцену.

Промт для аватара

"Создай аватар для профиля: портрет крупным планом, нейтральный однотонный фон, мягкий студийный свет, дружелюбное выражение лица, современный стиль, квадратный формат"

Иллюстрация к промту
Иллюстрация к промту

Промт для восстановления фотографии

"Восстанови это фото: убери царапины, заломы и пятна, выровняй цвет и контраст, сохрани лица и детали без искажений, не добавляй новых элементов"

Иллюстрация к промту
Иллюстрация к промту

Промт для карточки товара на маркетплейс

"Создай фото товара для карточки на маркетплейсе: белый фон, товар в центре, мягкая тень, ровный свет со всех сторон, чёткие детали и текстура материала, без лишних предметов"

Иллюстрация к промту
Иллюстрация к промту

Промт для портрета

"Создай реалистичный портрет: человек смотрит в камеру, мягкий естественный свет, нейтральный фон, спокойное выражение лица, лёгкое размытие фона, без сильной ретуши"

Иллюстрация к промту
Иллюстрация к промту

Промт для создания одежды

"Создай визуализацию одежды: лёгкое летнее платье на манекене, светлый фон, вид спереди и сбоку, натуральные ткани, современный минималистичный стиль, без лишних деталей на фоне"

Иллюстрация к промту
Иллюстрация к промту

Промт для улучшения качества фотографии

"Улучши это фото: убери шум и размытость, повысь чёткость деталей, сохрани естественные цвета и текстуры, не меняй композицию и содержание кадра"

Иллюстрация к промту
Иллюстрация к промту

Промт для черно белой фотографии

"Преобразуй фото в чёрно-белое: контрастная классическая тонировка, сохрани глубину теней и мягкость светлых участков, лёгкая естественная зернистость, без цветных оттенков"

Иллюстрация к промту
Иллюстрация к промту

Промт для женской ИИ фотосессии

"Создай фотосессию в деловом стиле: женщина в светлом костюме, современный офис на фоне, мягкий дневной свет, уверенная поза, естественная улыбка, лёгкое размытие фона"

Иллюстрация к промту
Иллюстрация к промту

Промт для мужской ИИ фотосессии

"Создай портретную фотосессию в повседневном стиле: мужчина в тёмном свитере, городская улица на фоне, вечерний свет, спокойная поза, естественные тени, без постановочности"

Иллюстрация к промту
Иллюстрация к промту

Промт для обработки фотографий

"Обработай фото: выровняй горизонт, убери лишние предметы по краям кадра, скорректируй баланс белого, добавь лёгкий контраст, сохрани естественный вид кадра"

Иллюстрация к промту
Иллюстрация к промту

Промт для создания персонажей

"Создай концепт персонажа для истории: герой в фэнтезийном костюме, динамичная поза, яркая, но не пёстрая цветовая гамма, простой фон, без текста и подписей"

Иллюстрация к промту
Иллюстрация к промту

Промт для фотографии девушки

"Создай портретное фото: естественный дневной свет, простой светлый фон, спокойное выражение лица, лёгкая ненавязчивая ретушь, вертикальный формат"

Иллюстрация к промту
Иллюстрация к промту

Принцип везде один: объект, назначение, стиль, свет, ограничения. Меняются только вводные, а система построения запроса остаётся той же, что и в разделах выше.

С чего начать генерацию изображений

Вся инструкция сводится к одной мысли: чем точнее вы объясните задачу, тем ближе результат будет к тому, что у вас в голове. Не нужно знать программы для дизайна и разбираться в технических настройках - достаточно уметь описать сцену так, как вы бы описали её другому человеку.

Вопросы и ответы

Можно ли использовать изображения, сгенерированные в ChatGPT, в коммерческих целях?+

По условиям OpenAI права на результат генерации переходят пользователю, и использовать такие изображения в рекламе, соцсетях и на маркетплейсах можно. Осторожнее стоит быть с промтами, где фигурируют чужие бренды, логотипы или узнаваемые персонажи - такие картинки лучше не публиковать.

Почему ChatGPT иногда отказывается генерировать изображение?+

Чаще всего дело в промте с запрещенным содержимым: реалистичное изображение конкретного человека без его согласия, известный персонаж под защитой авторского права, откровенный или жестокий контент. Обычно достаточно переформулировать запрос и убрать спорную часть.

Можно ли сгенерировать в ChatGPT изображение с реальным человеком?+

Нет, политика OpenAI запрещает создавать реалистичные изображения конкретных людей без их согласия. Для похожих задач образ лучше описывать обобщенно, без привязки к реальному имени.

Чем генерация в ChatGPT отличается от Midjourney?+

ChatGPT лучше работает в диалоге, точнее следует тексту, аккуратнее редактирует и вставляет надписи на картинке. Midjourney традиционно сильнее в чисто художественных, сильно стилизованных изображениях. Для рекламных креативов и карточек с текстом обычно удобнее ChatGPT.

Сколько времени занимает генерация одной картинки?+

Обычно от нескольких секунд до пары минут для сложных многодетальных сцен - зависит от режима, быстрого или с рассуждением.