Київ
вологість:
тиск:
вітер:
Погода на 10 днів від
sinoptik.ua
Чи здатний штучний інтелект замінити фрілансерів
Три роки минуло з моменту виходу ChatGPT, але чи готовий він замінити дизайнера, програміста чи аналітика? Дослідження, проведене Scale AI та Центром безпеки ШІ, кидає виклик оптимістичним заявам технологічних гігантів. Науковці протестували ChatGPT, Gemini та Claude на сотнях реальних проєктів із фріланс-платформ, і результати виявилися вражаючими.
Про це пише
Washington Post
.
Деталі дослідження
Дослідники Remote Labor Index відмовилися від штучних прикладів. Вони взяли проєкти, за які реальні люди отримували гроші: 3D-анімацію продуктів, транскрибування музики, створення веб-ігор та форматування наукових праць.
Результат вразив: найкраща система ШІ впоралася лише з 2,5% проєктів. Для порівняння, майже половина завдань була виконана з низькою якістю, а третина — взагалі залишилася незавершеною.
ШІ часто створював пошкоджені файли або просто ігнорував ключові вимоги замовника. Навіть коли результат виглядав привабливо на перший погляд, детальний аналіз виявляв критичні недоліки.
У проєкті з дизайну інтер’єру ШІ створив правдоподібний план поверху, але він був повністю технічно неправильним та не містив необхідної деталізації.
З аналітикою даних ШІ впорався також не без проблем. При створенні панелі візуалізації даних про щастя ШІ накладав текст на графіки, плутав кольори та «губив» цілі країни.
Розробка ігор також не піддалася штучному інтелекту. Створена гра була придатною до використання, але ШІ повністю проігнорував задану тему (пивоваріння), створивши абстрактний продукт.
Джейсон Хаузенлой, один із авторів дослідження, виділяє два головні обмеження сучасних систем, зокрема відсутність довгострокової пам’яті та проблеми з візуальним розумінням.
ШІ не вміє вчитися на помилках у межах одного проєкту, що триває тижні, і не запам’ятовує фідбек замовника. Чат-боти намагаються створити 3D-моделі через написання коду, а не через роботу з візуальними інтерфейсами, як це робить людина. Як результат — навушники в рекламному ролику змінюють вигляд у кожному кадрі.
Попри низькі показники, позитивна динаміка все ж існує. Нова модель Gemini 3 Pro, протестована у листопаді 2025 року, виконала 1,3% завдань, тоді як її попередня версія ледь дотягувала до 0,8%.
Тенденція до автономії ШІ зберігається. Компанії вже зараз відчувають, що один працівник із доступом до чат-бота може зробити більше, ніж раніше.
Проте повна заміна фахівця поки залишається науковою фантастикою.
Для економії це вигідно: створення гри людиною коштувало дослідникам $1485, тоді як запуск Claude Sonnet обійшовся менше ніж у $30. Але різниця в якості поки що залишається аргументом на користь людської праці.
Також за темою
Чи здатний штучний інтелект замінити фрілансерів
Названо найбезпечніші нові авто
Garmin випускає новий смарт-годинник із супутниковим та стільниковим зв’язком (фото, відео)
Honda представила новий логотип (фото)
Дебютував флагманський кросовер Renault (фото)
13 найгірших смартфонів в історії (фото)
Названо найбезпечніші нові авто
Garmin випускає новий смарт-годинник із супутниковим та стільниковим зв’язком (фото, відео)
Honda представила новий логотип (фото)
Дебютував флагманський кросовер Renault (фото)
13 найгірших смартфонів в історії (фото)
Джерело: finance.ua
Завантажуєм курси валют від minfin.com.ua
Новини рубріки
Garmin випускає новий смарт-годинник із супутниковим та стільниковим зв’язком (фото, відео)
18 січня 2026 р. 05:19
Honda представила новий логотип (фото)
18 січня 2026 р. 04:23
На Занзібарі створять «кібермісто» для прихильників криптовалют
18 січня 2026 р. 03:27