Математики не смогли превзойти нейросеть в решении сложных задач
Фото: Golden Dayz / Shutterstock / FOTODOM
В Беркли состоялось двухдневное закрытое мероприятие с участием тридцати ведущих математиков мира. Целью тайной встречи, о которой ученым запрещено было распространяться, стало испытание новой разработки компании OpenAI — чат-бота o4-mini, обладающего способностью к сложным логическим рассуждениям.
Ученые сразились в интеллектуальной схватке с «рассуждающим» чат-ботом, которому было поручено решать задачи, придуманные математиками. Нейросеть оказалась способна ответить на некоторые из самых сложных задач в мире, а участники математического конклава склонны были приравнять ИИ-модель к «математическому гению».
Для оценки способностей o4-mini был создан специальный набориз 300 уникальных математических задач разного уровня сложности — от студенческого до исследовательского, ответы на которые еще не были опубликованы. А самим ученым было запрещено что-либо обсуждать друг с другом в обычных мессенджерах и электронной почте, для чистоты эксперимента. За каждую задачу, которую ИИ не смог бы решить, автору полагалось вознаграждение в $7500. В итоге группе все же удалось найти 10 вопросов, которые загнали бота в тупик.
Мы используем cookie-файлы, чтобы улучшить сервисы для вас. Если ваш возраст менее 13 лет, настроить cookie-файлы должен ваш законный представитель. Больше информации
Нет комментариев