AlphaGeometry2: как ИИ покоряет вершины математического мышления

Искусственный интеллект давно стремится имитировать логическое мышление, свойственное человеку. Несмотря на значительный прогресс в распознавании образов, абстрактное мышление и символьная дедукция остаются сложными задачами для ИИ. Это ограничение особенно заметно при использовании ИИ для решения математических задач – области, которая долгое время служила примером когнитивных способностей человека, таких как логическое мышление, креативность и глубокое понимание. В отличие от других разделов математики, опирающихся на формулы и алгебраические преобразования, геометрия требует не только структурированного, пошагового мышления, но и способности распознавать скрытые взаимосвязи и умения конструировать дополнительные элементы для решения задач.

Долгое время считалось, что эти способности присущи только людям. Однако Google DeepMind работает над созданием ИИ, способного решать эти сложные задачи. В прошлом году компания представила AlphaGeometry – систему ИИ, которая сочетает в себе предсказательную силу нейронных сетей со структурированной логикой символьных рассуждений для решения сложных геометрических задач. Эта система добилась значительных успехов, решив 54% геометрических задач Международной математической олимпиады (IMO), что соответствует уровню серебряных призеров. Недавно компания пошла еще дальше, представив AlphaGeometry2, которая достигла невероятного показателя решаемости в 84%, превзойдя среднего золотого медалиста IMO.

AlphaGeometry2 демонстрирует ключевые инновации, которые позволили ей достичь такого уровня производительности, и показывает, что это значит для будущего ИИ в решении сложных задач, требующих логического мышления. AlphaGeometry – это система ИИ, предназначенная для решения сложных геометрических задач на уровне IMO. По сути, это нейро-символическая система, которая сочетает в себе нейронную языковую модель с механизмом символьной дедукции. Нейронная языковая модель помогает системе предсказывать новые геометрические конструкции, в то время как символьный ИИ применяет формальную логику для создания доказательств. Такая структура позволяет AlphaGeometry мыслить больше как человек, сочетая возможности распознавания образов нейронных сетей, которые воспроизводят интуитивное человеческое мышление, со структурированным мышлением формальной логики, которое имитирует дедуктивные способности человека. Одним из ключевых нововведений в AlphaGeometry стал способ генерации обучающих данных. Вместо того чтобы полагаться на демонстрации, сделанные человеком, система создала один миллиард случайных геометрических диаграмм и систематически вывела взаимосвязи между точками и линиями. Этот процесс создал массивный набор данных из 100 миллионов уникальных примеров, помогая нейронной модели предсказывать функциональные геометрические конструкции и направляя символьный механизм к точным решениям. Этот гибридный подход позволил AlphaGeometry решить 25 из 30 олимпиадных задач по геометрии за стандартное время соревнований, что близко к результатам лучших участников-людей.

AlphaGeometry2 добивается улучшенной производительности за счет нескольких улучшений: система способна работать с более широким спектром геометрических задач и быстрее решать задачи. AlphaGeometry2 преодолевает ограничения, представляя более продвинутую языковую модель, которая позволяет ей описывать и анализировать сложные задачи. В результате теперь она может решать 88% всех геометрических задач IMO за последние два десятилетия, что значительно больше, чем предыдущие 66%. Улучшенный символьный механизм, который служит логическим ядром системы, был усовершенствован несколькими способами. Во-первых, он был улучшен для работы с более точным набором правил решения задач, что делает его более эффективным и быстрым. Во-вторых, теперь он может распознавать, когда разные геометрические конструкции представляют одну и ту же точку в задаче, что позволяет ему рассуждать более гибко. Наконец, механизм был переписан на C++ вместо Python, что сделало его более чем в 300 раз быстрее. Это ускорение позволяет AlphaGeometry2 быстрее и эффективнее генерировать решения.

Эффективность нейронной модели AlphaGeometry2 обусловлена ее обширным обучением на синтетических геометрических задачах. Первоначально AlphaGeometry сгенерировала один миллиард случайных геометрических диаграмм, чтобы создать 100 миллионов уникальных обучающих примеров. AlphaGeometry2 идет еще дальше, генерируя более обширные и сложные диаграммы, включающие сложные геометрические взаимосвязи. Кроме того, теперь она включает в себя задачи, требующие введения вспомогательных построений – вновь определенных точек или линий, которые помогают решить задачу, – что позволяет ей предсказывать и генерировать более сложные решения. Ключевым нововведением AlphaGeometry2 является новый подход к поиску, называемый Shared Knowledge Ensemble of Search Trees (SKEST). В отличие от своего предшественника, который полагался на базовый метод поиска, AlphaGeometry2 выполняет несколько поисков параллельно, причем каждый поиск учится у других. Этот метод позволяет ей исследовать более широкий спектр возможных решений и значительно улучшает способность ИИ решать сложные задачи за более короткое время. Еще одним ключевым фактором успеха AlphaGeometry2 является использование модели Gemini от Google – современной модели ИИ, которая была обучена на еще более обширном и разнообразном наборе математических задач. Эта новая языковая модель улучшает способность AlphaGeometry2 генерировать пошаговые решения благодаря улучшенному последовательному мышлению. Теперь AlphaGeometry2 может подходить к задачам более структурированно. Благодаря точной настройке своих прогнозов и обучению на различных типах задач система теперь может решить гораздо больший процент геометрических задач олимпиадного уровня.

Благодаря вышеупомянутым достижениям AlphaGeometry2 решает 42 из 50 геометрических задач IMO с 2000 по 2024 год, достигая 84% успеха. Эти результаты превосходят показатели среднего золотого медалиста IMO и устанавливают новый стандарт математического мышления, управляемого ИИ. Помимо впечатляющей производительности, AlphaGeometry2 также делает успехи в автоматизации доказательства теорем, приближая нас к системам ИИ, которые могут не только решать геометрические задачи, но и объяснять свои рассуждения так, чтобы это было понятно людям.

Переход от AlphaGeometry к AlphaGeometry2 показывает, как ИИ совершенствуется в решении сложных математических задач, требующих глубокого мышления, логики и стратегии. Это также означает, что ИИ больше не занимается только распознаванием образов – он может рассуждать, устанавливать связи и решать проблемы способами, которые больше похожи на логическое мышление человека. AlphaGeometry2 также показывает, на что может быть способен ИИ в будущем. Вместо того чтобы просто следовать инструкциям, ИИ может начать самостоятельно исследовать новые математические идеи и даже помогать в научных исследованиях. Объединив нейронные сети с логическим мышлением, ИИ может стать не просто инструментом, автоматизирующим простые задачи, а квалифицированным партнером, который помогает расширять человеческие знания в областях, основанных на критическом мышлении. Возможно, мы вступаем в эпоху, когда ИИ доказывает теоремы и делает новые открытия в физике, технике и биологии. По мере того как ИИ переходит от грубых вычислений к более вдумчивому решению проблем, мы, возможно, находимся на пороге будущего, где люди и ИИ работают вместе, чтобы раскрыть идеи, которые мы никогда не считали возможными.

 

ИИ и мозг: грозит ли человечеству атрофия критического мышления?

Автоматизация разметки данных: прорыв ProVision

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *