Google DeepMind представила Genie 3 ― новую версию ИИ-модели для создания виртуальных миров в реальном времени. Об этом сообщает The Verge.
В отличие от традиционных игр, где окружение создается вручную, Genie генерирует миры полностью с помощью ИИ ― по запросу пользователя или изображению. В таких мирах (их называют «модели мира») могут в реальном времени взаимодействовать пользователи и ИИ-агенты. Эти виртуальные среды используются не только для развлечения, но и для обучения или тренировки ИИ-агентов.
По словам DeepMind, благодаря Genie 3 взаимодействие с такими мирами будет продолжительнее. Предыдущая версия ― Genie 2 ― могла поддерживать интерактивность не более одной минуты. Новая же модель позволит пользователям взаимодействовать с миром несколько минут.
Созданные миры работают в разрешении 720p с частотой 24 кадра в секунду.
Кроме того, Genie 3 научилась на одну минуту запоминать, где находятся объекты: если пользователь отвернется от стены с надписью, а потом снова на нее посмотрит, то надпись останется на месте. Еще одно нововведение ― возможность по текстовому запросу поменять погоду или добавить новые персонажи в виртуальную среду.
Впрочем, пока Genie 3 будет доступна лишь небольшой группе ученых и креаторов, чтобы разработчики смогли лучше изучить риски технологии.
У модели остается ряд ограничений: набор действий, доступный в виртуальных мирах, невелик, а четкий текст генерируется только в том случае, если был заранее задан в промте.