OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

27 березня 2025 р. 23:02

27 березня 2025 р. 23:02


OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.

Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.

Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.

Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.

Оскільки GPT-4o є «омніомодальною» моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.

Однак у моделі є певні обмеження:

  • Через підвищену деталізацію створення зображення може займати до однієї хвилини.
  • Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
  • Якщо в запиті недостатньо контексту, модель може «додумувати» деталі.
  • При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10−20 об’єктів одночасно.
  • Символи можуть відображатися некоректно або спотворюватися.
  • Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
  • Модель може некоректно відображати дрібні деталі.

OpenAI активно працює над поліпшенням цих аспектів у найближчі місяці.

Завдяки вдосконаленим заходам безпеки система блокуватиме можливість створення шкідливих зображень, таких як сексуальні підробки, а також запити на генерацію CSAM.

Усі зображення, створені за допомогою цієї технології, матимуть метадані C2PA, що позначатимуть їх як створені OpenAI.

OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

Джерело: finance.ua

Завантажуєм курси валют від minfin.com.ua