OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

Категорії

Світ Економіка Війна Технології Наука Авто Спорт Здоров'я Шоу-Бізнес Пізнавально Політика

Вінницькі Волинські Дніпровські Донецькі Житомирські Закарпатські Запорізькі Івано-Франківські Київські Кропивницькі Кримські Луганські Львівські Миколаївські Одеські Полтавські Рівненські Сумські Тернопільські Харківські Херсонські Хмельницькі Черкаські Чернігівські Чернівецькі

Погода

Київ

вологість:

тиск:

вітер:

Погода на 10 днів від sinoptik.ua

OpenAI представила покращений генератор зображень на базі GPT-4o для ChatGPT

27 березня 2025 р. 23:02

27 березня 2025 р. 23:02

OpenAI представила нову функцію генерації зображень на базі моделі GPT-4o, доступну для користувачів ChatGPT. Функція стане стандартною для всіх версій ChatGPT, і дозволяє створювати високоякісні зображення без необхідності окремого вибору моделі, як це було з DALL-E.

Генерація зображень на основі GPT-4o відрізняється від попередніх версій завдяки покращеній здатності точніше відтворювати текст, логотипи та інші складні елементи. Завдяки великій мультимодальній моделі, GPT-4o також може працювати з текстом, зображеннями, аудіо і відео, що дозволяє створювати зображення з різними об’єктами та сценаріями за допомогою лише одного запиту.

Google представляє нову модель Gemini, заявляючи, що вона розумніша за GhatGPT та DeepSeek

Для користувачів з безоплатним доступом залишаються колишні ліміти генерації (до трьох зображень на день), однак нова система демонструє кращу точність при створенні текстових елементів на зображеннях, у порівнянні з попередніми моделями. Оновлена система генерує зображення поетапно, зверху вниз і зліва направо, що дозволяє забезпечити більш детальне і коректне відображення всіх елементів.

Нова функція також дозволяє редагувати завантажені зображення, створюючи нові варіанти, використовуючи наявні зображення як візуальні натхнення.

Оскільки GPT-4o є «омніомодальною» моделлю, що працює з текстом, зображенням, аудіо та відео, вона здатна краще розуміти промпти користувачів, коли потрібно створити кілька об’єктів на зображенні.

Однак у моделі є певні обмеження:

Через підвищену деталізацію створення зображення може займати до однієї хвилини.
Довгі зображення, такі як постери, можуть обрізатися надто щільно, особливо в нижній частині.
Якщо в запиті недостатньо контексту, модель може «додумувати» деталі.
При створенні складних концепцій, наприклад, повної періодичної таблиці, модель може неточно відтворювати більше ніж 10−20 об’єктів одночасно.
Символи можуть відображатися некоректно або спотворюватися.
Виправлення окремих деталей (наприклад, орфографічних помилок) не завжди працює без побічних змін у зображенні.
Модель може некоректно відображати дрібні деталі.

OpenAI активно працює над поліпшенням цих аспектів у найближчі місяці.

Завдяки вдосконаленим заходам безпеки система блокуватиме можливість створення шкідливих зображень, таких як сексуальні підробки, а також запити на генерацію CSAM.

Усі зображення, створені за допомогою цієї технології, матимуть метадані C2PA, що позначатимуть їх як створені OpenAI.