Google представила нову систему штучного інтелекту, яка може суттєво змінити підхід до створення та редагування відео. Компанія обіцяє, що складний монтаж стане доступним навіть для користувачів без досвіду - достатньо буде просто описати потрібний результат у діалозі з нейромережею, пише Techradar .
Підпишись на наш Viber: новини, гумор та розваги!
ПідписатисяНа конференції Google I/O 2026 було показано мультимодальну модель Gemini Omni, що поєднує генерацію контенту, роботу з медіа та логічне розуміння запитів у єдиній системі. Першою версією стала Gemini Omni Flash, орієнтована перш за все на створення та обробку відео.
За задумом Google, нова технологія має знизити поріг входу у відеовиробництво. Користувач зможе працювати не з таймлайнами та складними інструментами монтажу, а із звичайними текстовими запитами. Система приймає різні типи даних – текст, зображення, аудіо та відео – і на їх основі формує або редагує ролики.
Ключова ідея проекту – так зване «розмовне редагування». Замість ручної роботи з ефектами, користувач може просто попросити змінити сцену: замінити фон, скоригувати освітлення або рух об'єктів. Модель при цьому повинна зберігати цілісність зображення та природність того, що відбувається.
Google також наголошує на фізичній реалістичності. Система краще моделює поведінку об'єктів, включаючи гравітацію та інерцію, що дозволяє створювати більш правдоподібні візуальні ефекти та складніші сцени.
Gemini Omni Flash вже починають впроваджувати в екосистему Google - додаток Gemini, сервіси YouTube Shorts і YouTube Create, а також платформу Google Flow. Надалі доступ до технології планується відкрити для розробників через API.
Розвиток проекту відбувається на тлі конкуренції, що посилюється, у сфері генеративного відео. Компанії прагнуть як поліпшити якість контенту, а й максимально спростити його створення. Google робить ставку саме на інтуїтивну взаємодію, коли робота з відео перетворюється на діалог із системою.
Окрему увагу приділено питанням прозорості. Весь контент, створений за допомогою Gemini Omni, автоматично маркуватиметься цифровим водяним знаком SynthID, який дозволить визначити, що матеріал створений штучним інтелектом. Такі механізми планується інтегрувати в сервіси Google, включаючи Chrome та пошукову систему.
Також користувачам запропонують створення персональних відеоаватарів із використанням власного голосу. При цьому складніші функції, пов'язані зі зміною особи або голосу в кадрі, поки проходять додаткову перевірку безпеки.
Таким чином, Google просуває ідею, при якій створення відео стає максимально простим і доступним, але супроводжується інструментами контролю та маркування AI-контенту.
Раніше ми розповідали, що TikTok запускає нову функцію : можна буде бронювати подорож і знаходити визначні пам'ятки, показані у відеороликах.
Крім того, "Знай" передавав