Київ
вологість:
тиск:
вітер:
Погода на 10 днів від
sinoptik.ua
OpenAI випустила gpt-oss — свої перші за 6 років відкриті ШІ-моделі
OpenAI
представила
дві нові великі мовні моделі (LLM) — потужнішу gpt-oss-120b та легшу gpt-oss-20b, які можна вільно використовувати та модифікувати. Це перший подібний реліз за останні шість років, після виходу моделі GPT-2 у 2019 році,
зазначає
TechCrunch.
Ключові характеристики та можливості:
- gpt-oss-120b містить 120 мільярдів параметрів, для її роботи потрібен графічний процесор (GPU) з 80 ГБ відеопам’яті;
- gpt-oss-20b має 20 мільярдів параметрів і може працювати на пристроях з GPU, що мають 16 ГБ відеопам’яті.
Згідно з синтетичними тестами, продуктивність gpt-oss-120b можна порівняти з моделлю o4-mini, а gpt-oss-20b — з o3-mini. При цьому обидві моделі поступаються флагманській o3-pro.
Обидві моделі підтримують ланцюжок роздумів (CoT), що дозволяє їм вирішувати складні завдання, розбиваючи їх на дрібніші кроки. Розробникам доступний повний ланцюжок роздумів для налагодження та розуміння логіки роботи.
У компанії пояснили, що відкриті моделі зможуть надсилати складні запити до більш потужних хмарних моделей. Це дозволить розробникам підключати відкриту модель до закритої, якщо перша не може виконати певне завдання, наприклад, обробити зображення.
Хоча на ранніх етапах свого існування OpenAI займалася розробкою відкритих моделей, згодом компанія обрала закритий підхід. Ця стратегія дозволила їй побудувати великий бізнес, продаючи доступ до своїх моделей через API.
Співпраця з AWS
Паралельно з анонсом OpenAI, Amazon
оголосила
, що нові моделі будуть доступні на її хмарній платформі Amazon Web Services (AWS). Це вперше моделі OpenAI з’являться на AWS, що є важливим конкурентним кроком, оскільки до цього моменту AWS в основному співпрацювала з головним конкурентом OpenAI, компанією Anthropic. Цей крок дозволить AWS зміцнити свої позиції на ринку ШІ, де Microsoft, ключовий партнер OpenAI, посідає лідерські позиції.
OpenAI наразі готується до свого наступного великого релізу — моделі GPT-5. Очікується, що вона буде представлена як комплексна система штучного інтелекту, що об’єднує різні моделі та здатна виконувати різноманітні функції, а не лише одну задачу.

Завантажуєм курси валют від minfin.com.ua
Новини рубріки

Volkswagen представив великий кросовер, дешевший за Tiguan (фото)
07 серпня 2025 р. 01:10

росія вкрала 15 млн тонн українського зерна
06 серпня 2025 р. 21:30