OpenAI випустила gpt-oss — свої перші за 6 років відкриті ШІ-моделі

06 серпня 2025 р. 23:48

06 серпня 2025 р. 23:48


OpenAI представила дві нові великі мовні моделі (LLM) — потужнішу gpt-oss-120b та легшу gpt-oss-20b, які можна вільно використовувати та модифікувати. Це перший подібний реліз за останні шість років, після виходу моделі GPT-2 у 2019 році, зазначає TechCrunch.

Ключові характеристики та можливості:

  • gpt-oss-120b містить 120 мільярдів параметрів, для її роботи потрібен графічний процесор (GPU) з 80 ГБ відеопам’яті;
  • gpt-oss-20b має 20 мільярдів параметрів і може працювати на пристроях з GPU, що мають 16 ГБ відеопам’яті.

Згідно з синтетичними тестами, продуктивність gpt-oss-120b можна порівняти з моделлю o4-mini, а gpt-oss-20b — з o3-mini. При цьому обидві моделі поступаються флагманській o3-pro.

Обидві моделі підтримують ланцюжок роздумів (CoT), що дозволяє їм вирішувати складні завдання, розбиваючи їх на дрібніші кроки. Розробникам доступний повний ланцюжок роздумів для налагодження та розуміння логіки роботи.

У компанії пояснили, що відкриті моделі зможуть надсилати складні запити до більш потужних хмарних моделей. Це дозволить розробникам підключати відкриту модель до закритої, якщо перша не може виконати певне завдання, наприклад, обробити зображення.

Хоча на ранніх етапах свого існування OpenAI займалася розробкою відкритих моделей, згодом компанія обрала закритий підхід. Ця стратегія дозволила їй побудувати великий бізнес, продаючи доступ до своїх моделей через API.

Співпраця з AWS

Паралельно з анонсом OpenAI, Amazon оголосила , що нові моделі будуть доступні на її хмарній платформі Amazon Web Services (AWS). Це вперше моделі OpenAI з’являться на AWS, що є важливим конкурентним кроком, оскільки до цього моменту AWS в основному співпрацювала з головним конкурентом OpenAI, компанією Anthropic. Цей крок дозволить AWS зміцнити свої позиції на ринку ШІ, де Microsoft, ключовий партнер OpenAI, посідає лідерські позиції.

OpenAI наразі готується до свого наступного великого релізу — моделі GPT-5. Очікується, що вона буде представлена як комплексна система штучного інтелекту, що об’єднує різні моделі та здатна виконувати різноманітні функції, а не лише одну задачу.

OpenAI випустила gpt-oss — свої перші за 6 років відкриті ШІ-моделі

Джерело: finance.ua

Завантажуєм курси валют від minfin.com.ua