вологість:
тиск:
вітер:
DeepSeek представила нову модель штучного інтелекту V4
Китайська компанія DeepSeek представила нову флагманську серію моделей штучного інтелекту V4 Flash та V4 Pro. Розробники називають її найпотужнішою платформою з відкритим кодом і прямим конкурентом OpenAI та Anthropic. Стартап також заявив про значне зниження вартості роботи моделі після запуску нових обчислювальних кластерів Huawei, через які раніше відкладали вихід моделей , передає Bloomberg .
🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.…
pic.twitter.com/n1AgwMIymu
DeepSeek розгорнула версії нової флагманської моделі штучного інтелекту V4 через рік після гучного запуску моделі R1 , яка суттєво вплинула на ринок ШІ. Компанія представила V4 Flash та V4 Pro, заявивши про високі результати в тестах програмування, міркувань та агентних завдань.
У компанії наголосили, що нова архітектура отримала суттєві оновлення. Зокрема, йдеться про так звану “гібридну архітектуру уваги”, яка покращує здатність моделі запам’ятовувати контекст під час довгих діалогів.
Завдяки цьому контекстне вікно V4 збільшили до 1 мільйона токенів. Це дозволяє завантажувати цілі кодові бази або великі документи в одному запиті без втрати якості обробки.
Нова система використовує архітектуру Mix-of-Experts із трильйоном параметрів. При цьому для конкретного завдання активується лише до 37 мільярдів параметрів, що суттєво знижує витрати на обчислення порівняно з аналогічними моделями.
DeepSeek заявляє, що V4 Pro наразі має дуже обмежені обчислювальні ресурси через дефіцит потужностей. Однак після запуску нових кластерів на базі чипів Huawei Ascend 950 у другій половині 2026 року компанія очікує значного зниження цін.
DeepSeek також веде переговори з Tencent Holdings та Alibaba Group щодо першого раунду фінансування. Це може стати важливим кроком для масштабування бізнесу на тлі конкуренції з американськими технологічними компаніями.
Компанія підкреслює, що її модель конкурує з останніми розробками OpenAI, Google та Anthropic не лише за продуктивністю, а й за вартістю використання. V4 орієнтована на розгортання на дешевшій інфраструктурі, що робить її привабливою для бізнесу.
“Зрештою, розрив у продуктивності моделі буде непомітним для більшості користувачів”, — заявив директор Union Bancaire Privée Вей-Серн Лінг.
Разом із популярністю DeepSeek зросла й увага з боку США. Американські урядовці та технологічні компанії підозрюють компанію у використанні заборонених чипів Nvidia Blackwell , а також у можливому застосуванні дистиляції — навчання на результатах моделей OpenAI та Anthropic .
Джерело: zn.ua (Політика)
Новини рубріки
Військова служба правопорядку відреагувала на інцидент з бійцями 14-ї бригади
24 квітня 2026 р. 11:23
Через атаки та негоду без світла залишаються споживачі 10 областей – Міненерго
24 квітня 2026 р. 11:23
Військовий облік: кого можуть виключити з нього
24 квітня 2026 р. 11:06