Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

10 липня 2025 р. 19:08

10 липня 2025 р. 19:08


Купуйте річну передплату на 6 журналів Forbes Ukraine зі змістовними матеріалами, рейтингами та аналітикою від 1 350 грн .

Деталі

  • З четверга підписники планів Google AI Ultra та Pro в окремих регіонах зможуть використовувати функцію через вебверсію Gemini, а протягом тижня – у мобільному додатку. Користувачі можуть створювати 8-секундні відео зі звуком у форматі MP4 (720p, 16:9) на основі фото та текстового опису.
  • Функція, інтегрована в чат-інтерфейс Gemini, допомагає Google конкурувати з OpenAI, Runway AI та китайськими компаніями, як-от Alibaba та Kuaishou.
  • Вона працює на базі моделі Veo 3, представленої в травні. Google забороняє створювати відео з публічно відомими особами чи контент, що заохочує насильство.
  • Під час тестування Bloomberg News виявив, що інструмент може змінювати риси обличчя чи расу суб’єктів. Прості завдання, як анімація рослин чи тварин, виконуються краще, ніж складні, наприклад, створення відео з брейкдансом.
  • Google пояснює, що це нова технологія, яка краще анімує об’єкти чи природу, і планує її вдосконалювати.

Контекст

Google вперше представив модель генерації відео Veo у травні 2024 року на конференції Google I/O. Вона створювала відео у форматі 1080p тривалістю понад хвилину за текстовими запитами, забезпечуючи складні сцени, реалістичні рухи та кінематографічні ефекти.

У грудні 2024 року вийшла оновлена версія Veo 2 , яка підтримувала роздільну здатність 4K і краще відтворювала фізичні рухи об’єктів, їхню поведінку та освітлення. У квітні 2025 року Veo 2 стала доступною для обмеженої аудиторії через додаток Gemini.

У травні Google анонсував Veo 3 – найсучаснішу модель, яка не лише генерує відео у 4K, а й синхронізує їх із музикою, голосом або звуковими ефектами. Veo 3 інтегрована в плани Gemini (Pro/Ultra) та Google Cloud Vertex AI. Для захисту від зловживань Google використовує технологію SynthID для прихованих цифрових водяних знаків, а також видимі мітки.

У червні CNBC повідомило, що Google використовував відео з YouTube для тренування моделей Veo та Gemini без явної згоди авторів і без можливості відмови . Хоча Google заявляє про відповідність умовам YouTube, критики вказують на проблеми з авторськими правами та прозорістю.

Google представив функцію перетворення зображень на короткі відеокліпи за допомогою ШІ

Джерело: forbes.ua (Новини)

Завантажуєм курси валют від minfin.com.ua