Укрдержархів передав 10 терабайтів даних для навчання національного ШІ "Сяйво"

10 квітня 2026 р. 18:55

10 квітня 2026 р. 18:55


Державна архівна служба України передала близько 10 терабайтів інформації для навчання національної великої мовної моделі (LLM) "Сяйво". Такий обсяг даних відповідає масиву текстів у 70 000 книжок.

Як пише Delo.ua , про це повідомила пресслужба Мінцифри.

Метою проєкту є створення штучного інтелекту, який розуміє український контекст, історію та діалекти без використання перекладу з англійської мови.

"Для тренування національної мовної моделі ми збираємо дані, щоб мовна модель була натренована на унікальному масиві інформації. Це державні документи, наукові статті... історичні матеріали, закони, судові рішення тощо", — повідомив в. о. міністра цифрової трансформації Олександр Борняков.

LLM "Сяйво" вивчатиме унікальні набори даних: історичні джерела, рукописи, закони, судові рішення, медіа матеріали, наукові статті та словники. Наразі понад 50 партнерів, серед яких університети, бібліотеки та медіа, вже надали свої матеріали для збору якісної бази знань.

Голова Укрдержархіву Анатолій Хромов зазначив, що до кінця 2026 року кількість цифрових копій у державних архівах зросте з 150 млн до понад 200 млн.

"Це унікальний випадок, коли Укрдержархів вперше надає свої дані для розвитку цифрових сервісів в Україні... До кінця 2026 року кількість цифрових копій держархівів збільшаться із 150 млн до понад 200 млн", — підкреслив керівник архіву, зазначивши, що швидкість оцифрування архівної спадщини в Україні є однією з найвищих у світі.

Нагадаємо,30 березня українці обрали назву для національної великої мовної моделі штучного інтелекту через застосунок "Дія". У голосуванні взяли участь 136 090 користувачів, а переможним варіантом стала назва "Сяйво" (Siaivo), яка отримала 22 601 голос.

Укрдержархів передав 10 терабайтів даних для навчання національного ШІ "Сяйво"

Джерело: delo.ua (Бізнес)

Завантажуєм курси валют від minfin.com.ua