OpenAI выпустила превью языковой модели o1, известной внутри компании как Strawberry. Она может решать задачи, требующие глубоких рассуждений наподобие человеческих, сообщается в блоге разработчика.
o1 тратит больше времени на обдумывание ответа, прежде чем показать его пользователям. Так, модель берет паузу на несколько секунд, чтобы проанализировать ряд связанных подсказок и собрать из них лучший ответ. В компании пояснили, что модель научили «оттачивать мыслительный процесс, пробовать разные стратегии и распознавать свои ошибки».
С помощью этого инструменты OpenAI должны быть способны решать многоуровневые задачи, включая сложные математические и из сферы программирования. В тестах по физике, химии и биологии модели отвечали на уровне аспирантов, а в отборочном туре Международной математической олимпиады (IMO) предыдущая модель правильно решила 13% заданий, а новая o1 — 83%.
«Как ранняя модель, она пока не обладает многими функциями, которые делают ChatGPT полезным, — просмотром сайтов для получения информации и загрузкой файлов и изображений. Но для сложных задач для рассуждения это значительный прогресс и новый уровень возможностей ИИ. Учитывая это, мы сбрасываем счетчик обратно на 1 и называем эту серию OpenAI o1», — заявили разработчики компании.
Бета-версия модели доступна пользователям чат-бота ChatGPT с подписками Plus и Team 12 сентября.
Релиз o1 произошел на фоне попыток OpenAI привлечь миллиарды долларов от инвесторов и возросшей конкуренции в гонке за разработку все более сложных систем ИИ. OpenAI — не единственная компания, работающая над такими возможностями: конкуренты Anthropic и Google также анонсировали навыки человеческого рассуждения у своих моделей.