OpenAI представила модель ИИ, которая «думает» перед тем, как дать ответ
Компания OpenAI представила свою последнюю модель искусственного интеллекта под кодовым названием Strawberry и официальным названием OpenAI o1, сообщает TechCrunch. Модель является частью семейства, включающей две версии: o1-preview и o1-mini, причем последняя разработана как меньше и эффективнее, предназначенная в первую очередь для генерации кода.
OpenAI o1 доступна для подписчиков ChatGPT Plus и Team, а ранний доступ для корпоративных и образовательных пользователей будет открыт на следующей неделе. Однако модель o1 пока что относительно базовая. В отличие от своего предшественника, GPT-4o, ей не хватает возможностей веб-браузинга или анализа файлов, и хотя она имеет функции анализа изображений, они временно отключены для дальнейшего тестирования. Кроме того, эта модель ограничена по скорости, позволяя всего 30 сообщений в неделю для o1-preview и 50 для o1-mini.
Недостаток новой модели — также ее стоимость. o1-preview имеет высокую цену в API — $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что значительно дороже GPT-4o. Несмотря на эти проблемы, OpenAI планирует сделать o1-mini доступным для всех пользователей бесплатного ChatGPT, хотя конкретная дата релиза еще не объявлена.
Что отличает o1 от других моделей генеративного ИИ, так это его способность «проверять себя», тратя дополнительное время на рассмотрение различных аспектов запроса перед тем, как ответить. Эта способность позволяет модели «думать» более эффективно, что делает ее пригодной для сложных задач, требующих более высокого уровня синтеза, таких как анализ электронных писем на предмет привилегированной информации или мозговой штурм маркетинговых стратегий.
По данным OpenAI, o1 использует обучение с подкреплением, поощряя модель «думать», прежде чем ответить, имитируя цепочку мыслей. Это подкрепляется системой поощрений и наказаний, что помогает модели планировать заранее и выполнять несколько действий для получения ответа. Таким образом, в теории, чем дольше OpenAI o1 обрабатывает запрос, тем лучше будет ответ.
Хотя o1 превосходит свои возможности в таких областях, как анализ данных, наука и кодирование, модель имеет определенные ограничения. Например, она может быть медленнее других моделей, отвечая на определенные запросы более 10 секунд. Кроме того, первые тестировщики сообщали, что o1 может «галюцинировать» (генерировать неправильные, но уверенные ответы) чаще, чем GPT-4o, и менее склонна признавать, что не знает ответа.
Несмотря на эти проблемы, OpenAI считает, что o1 — шаг вперед в рассуждениях ИИ. Исследователи Google DeepMind продемонстрировали аналогичные улучшения точности модели, давая своим моделям больше времени на вычисление ответов, что подчеркивает жесткую конкуренцию в области ИИ. Интересно, что OpenAI решил не показывать необработанные «цепочки мыслей» o1 в ChatGPT, ссылаясь на проблемы конкуренции, и вместо этого решил показывать «сгенерированные моделью резюме» этих цепочек.
Окончательным испытанием OpenAI станет обеспечение широкой доступности o1 по более приемлемой цене. Компания планирует продолжать совершенствовать модель, экспериментируя с версиями, которые могли бы размышлять в течение длительных периодов — от часов до дней или даже недель — для дальнейшего улучшения ее способностей к размышлениям.