jstmeowme Aug 12 2024 at 10:59

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

1 min

2.7K

BotHub corporate blogArtificial IntelligenceMathematics * Machine learning *

Comments 9

AlexMoskvichev Aug 12 2024 at 12:20

Задачи любой сложности? В математике хорошо бы поаккуратней (поточнее) формулировать. Наверное имелось ввиду Может решить некоторые сложные задачи. Или правда любой? Открытые математические проблемы

AlexMoskvichev Aug 12 2024 at 12:42

Интересно было бы почитать про детали разработки таких моделей. Извините, что задушнил в первом комментарии, но от хайповых заголовков про ИИ уже глаз дергается :(

freeExec Aug 12 2024 at 15:00

Если ее тренировали на всех доступных человечеству решениях, то думаю можно и так заявлять. Т.е. задачу любой сложности, которую можно решить, он типа должен осилить.

Pshir Aug 12 2024 at 16:43

В конце новости написано: она может достаточно успешно решать школьные задачки. На этом всё.

NeoCode Aug 12 2024 at 12:39

Ну не знаю, математика наука точная, а тут LLM... Все-же для математики лучше какая-то связка LLM+символьные вычисления. То есть LLM используется для неточного эвристического поиска путей решения, но сами решения генерируются точной символьной моделью. Все это со множеством взаимных обратных связей между языковой и символьной частями. Вот такая связка действительно могла бы показать интересные результаты в плане решения нерешенных задач и тому подобного.

UFO landed and left these words here

Pshir Aug 12 2024 at 16:42

Результат 47.8% в College math, то есть пока что эта модель даже для помощи ленивым и/или тупым студентам в решении стандартных задач из учебника не подходит. Тогда вопрос к автору публикации, каким образом заголовок заметки соотносится с её содержанием?

funca Aug 12 2024 at 20:43

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

"LLM для решения" это может быть про цель, а не результат. Ни кто не утверждал, что LLM их решает. Логика.

NekkittAY Aug 15 2024 at 05:56

Как я примерно понял, весь основной алгоритм заключается в переводе текста с помощью LLM в символьные выражения: текст в LaTeX -> перевод с LaTeX в SymPy выражения (библиотека python для символьных и аналитических вычислений, как система компьютерной алгебры) -> вычисления SymPy -> вывод текста и объяснение результатов с помощью LLM. В код сильно не всматривался, просто прикинул, может ошибаюсь, но на основе моих тестов модель очень плохо справляется с геометрическими задачами (просто задание по планиметрии как из ЕГЭ 2 части), на русском естественно спрашивать бессмысленно, пока нормально понимает только английский. В целом результат закономерен, сведение слов в уравнения/неравенства и их решение, так что с геометрией будут проблемы пока (хотя для геометрических задач есть модель от Google - Alpha Geometry, не проверял, но, тесты показывали отличные результаты). Так что "LLM для решения математических задач любой сложности" - пока слишком сильное заявление.