Лабораторія досліджень штучного інтелекту OpenAI запустила штучний інтелект Sora, що вміє перетворювати текст і нерухоме зображення у відео або розширювати відео, яке вже існує, і заповнювати відсутні кадри в ньому.

AI Sora генерує відео тривалістю до хвилини за вказівками користувача. Тут можна створити деталізоване відео з багатьма персонажами, різними типами руху й кількома кадрами в ньому.

Згенероване у AI Sora відео. Вказівка: «Гарне, засніжене місто Токіо вирує. Камера рухається жвавою вулицею міста, слідуючи за кількома людьми, які насолоджуються прекрасною сніжною погодою й роблять покупки в найближчих кіосках. Розкішні пелюстки сакури летять на вітрі разом зі сніжинками».

Утім, застосунок може поки не розуміти конкретні випадки причинно-наслідкових звʼязків або помилятися з просторовими вказівками: плутати ліве й праве, мати труднощі з хронологічно точним описом подій, зазначають розробники. «Наприклад, людина може відкусити шматочок печива, але після цього на печиві може не залишитися сліду від укусу», – додають у компанії.

Згенероване у AI Sora відео. Вказівка: «Кілька гігантських мамонтів наближаються, ступаючи по засніженій галявині, їхнє довге хутро злегка розвівається на вітрі, коли вони йдуть. Укриті снігом дерева й драматичні засніжені гори вдалині, полуденне світло з купчастими хмарами, і сонце високо вдалині створює тепле сяйво, низький ракурс камери приголомшливо захоплює великого пухнастого ссавця з прекрасною фотографією, глибиною різкості».

Зараз AI доступний для red teamers – команди людей, які перевіряють безпеку застосунку, поширення в ньому дезінформації й контенту, що може розпалювати ненависть й упередження. Доступ до тестування надали й деяким художникам, дизайнерам і режисерам.

З питань безпеки для Sora також застосують класифікатор текстів OpenAI для перевірки й відхилення вказівок, у яких ідеться про насильство, сексуальний контент, образливі зображення, зокрема схожі на публічних людей або ті, що порушують інтелектуальну власність. Крім цього, OpenAI розробляє інструмент для виявлення оманливого контенту, який був згенерований у Sora.

   

У березні 2023 року OpenAI випустив нову «більш потужну» версію штучного інтелекту ChatGPT. GPT-4 може працювати одразу з текстом і зображеннями. Нейромережа аналізує текст і значення на зображеннях і може розвʼязувати задачі з ними.

Обкладинка: скриншот із відео OpenAI