Google навчила Gemini 2.5 розуміти та передавати емоції у діалогах

Категорії

Світ Економіка Війна Технології Наука Авто Спорт Здоров'я Шоу-Бізнес Пізнавально Політика

Вінницькі Волинські Дніпровські Донецькі Житомирські Закарпатські Запорізькі Івано-Франківські Київські Кропивницькі Кримські Луганські Львівські Миколаївські Одеські Полтавські Рівненські Сумські Тернопільські Харківські Херсонські Хмельницькі Черкаські Чернігівські Чернівецькі

Погода

Київ

вологість:

тиск:

вітер:

Погода на 10 днів від sinoptik.ua

Google навчила Gemini 2.5 розуміти та передавати емоції у діалогах

05 червня 2025 р. 08:44

05 червня 2025 р. 08:44

На конференції Google I/O 2025 компанія анонсувала нову версію своєї мультимодальної моделі Gemini 2.5 , яка тепер підтримує генерацію аудіо та діалогів у реальному часі. Ці можливості доступні у попередній версії для розробників через платформи Google AI Studio та Vertex AI. Gemini 2.5 Flash Preview забезпечує реалістичну голосову взаємодію з ШІ, включаючи розпізнавання емоційного забарвлення мови, адаптацію інтонації та акценту, а також можливість перемикання між більш ніж 24 мовами. Модель може ігнорувати шуми фону та використовувати зовнішні інструменти, такі як «Пошук», для отримання актуальної інформації під час діалогу.

Додатково, Gemini 2.5 пропонує розширені функції синтезу мови (TTS), дозволяючи керувати стилем, темпом та емоційною виразністю озвучування. Підтримується генерація діалогів з кількома голосами, що робить модель придатною для створення подкастів, аудіокниг та інших мультимедійних продуктів.

Для забезпечення прозорості всі згенеровані моделлю аудіо маркуються за допомогою технології SynthID, що дозволяє ідентифікувати контент як згенерований ШІ. Розробники можуть випробувати нові функції через вкладки Stream і Generate Media в Google AI Studio. Gemini 2.5 демонструє значний крок вперед у галузі мультимодальних ШІ-систем, поєднуючи модальності текстів, зображень, аудіо та відео в єдину платформу. Нові функції відкривають широкі перспективи для створення інтерактивних програм, віртуальних асистентів та інновацій у сфері освіти.