当前位置：首页 >> 培训 >> 解决通用LLM“偏科”问题，数学大模型MathGPT要来了！

解决通用LLM“偏科”问题，数学大模型MathGPT要来了！

2023-07-13 15:55:11数学模型

机器之心原创

作者：蛋酱

数学大模型 MathGPT，专治大语言模型的「偏科」问题。

不做通用 LLM，不基于现有 LLM 做微调和接口调用，学而思自研的数学大模型 MathGPT 要来了。

这对于全世界的数学爱好者来说，都是个值得关注的好消息。

MathGPT 是面向全球数学爱好者和科研机构，以数学领域的解题和讲题算法为核心的大模型。据了解，学而思已将 MathGPT 定位为公司核心项目，由 CTO 田密负责，今年春节前，研发正在进行中，该项目已经启动相应的团队建设、数据、算力准备和技术研发。

进度方面，团队目前已经取得阶段性成果，今年内将推出基于该自研大模型的产品级应用。

此外，学而思已经启动在美国硅谷的团队建设，将成立一支海外算法和工程团队，在全球范围内招募优秀的人工智能专家加入。

大语言模型「偏科」，怎么解？

打造 MathGPT，可以比作「一项绕开大语言模型（LLM）能力短板的工程」。

OpenAI 在今年三月份发布了大语言模型 GPT-4，国内百度、阿里也发布了各自的大模型产品，这些大语言模型在语言翻译、摘要、理解和生成等任务上有出色表现。

但通用语言模型看上去更像一个「文科生」，目前已有的产品在数学问题的解决、讲解、问答和推荐方面还存在明显不足，即使是最先进的大语言模型也难以正确地回答大量数学问题。

一个非常生动的例子是，在 ChatGPT 刚发布之后的测试中，它被问到一个经典「鸡兔同笼」问题（如下图）。ChatGPT 写出的解题过程看上去非常有条理，但仔细一看 —— 答案却是错的？

解决通用LLM“偏科”问题，数学大模型MathGPT要来了！

有点「一本正经胡说八道」的意思。

计算机显然比人类更擅长具体的数学计算，但远没有透彻掌握「推理」这件事。在 AI 语言模型的「脑回路」中，复杂的数学方程式可能被视为了一种语言，而解决方案更像是「翻译问题」。

但「推理问题」恰恰需要许多其他类型问题不涉及的鲁棒性和严谨性。即使过程中的某一步出了一点差错，最终整个答案都将是错误的。尽管模型在更大的数据样本上训练之后往往会变得更加鲁棒并减少错误，但在推理这件事上，模型规模的扩展似乎不那么奏效。

而且，对于有些数学问题，虽然模型能够解决，但方法更偏成年人，无法针对适龄孩子的知识结构和认知水平做适配。

这让研究人员们意识到，训练语言模型解决数学问题和阐述思路似乎需要更有针对性的「定向训练」方法。

「这种不足是由 LLM 模型的自身特点决定的。」学而思 AI 团队负责人介绍，LLM 大模型来自对海量语言文本的训练，因此最擅长语言处理。行业内偏向基于 LLM 大模型做阅读、写作类应用，但如果想要在数学能力上有突破，就需要研发新的大模型。

正因此，学而思决心组建团队专研 MathGPT—— 数学领域大模型，用自己在数学和 AI 上的多年积累，面向全球范围内的数学爱好者和科研机构，做好 AI 大模型时代的数学基础工作。

总体来说，学而思希望通过 MathGPT 弥补和攻克大语言模型的三个问题：

第一，题目要解对，现在 GPT 结果经常出现错误；
第二，解题步骤要稳定、清晰，现在 GPT 的解题步骤每次都不一样，而且生成内容经常很冗余；
第三，解题要讲的有趣、个性化，现在 GPT 的解释过于「学术」和机械，对孩子的学习体验很不友好。

学而思 AI 团队表示，由于大语言模型的推理与计算能力有限，因此 MathGPT 需要结合大语言模型和计算引擎两者的能力，大语言模型需要理解题目、分步解析，并在合适的步骤自行调用计算引擎。

做 MathGPT，学而思有哪些技术储备？

当然，自研数学大模型不能只是一句口号，算法、算力、数据的技术储备缺一不可。对此，学而思也有自身的底气。

「以数学起家」，学而思至今已有 20 年的数学教学经验，积累了庞大的数学相关数据，这些数据为训练 MathGPT 提供了丰富的物料。另外，学而思的海外业务 Think Academy 在全球若干国家和地区深受数学爱好者喜欢，学而思的学生在每年的 IMO 和 AMC 等国际数学竞赛中表现优异，每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

作为获国家科技部批准的「智慧教育国家新一代人工智能开放创新平台」建设单位，也是教育行业首批唯一一家人工智能「国家队」成员，学而思在人工智能领域有着多年的深入研究。早在 2017 年，学而思便成立了 AI lab 人工智能实验室。

这些年，在海内外的多个顶级学术会议赛事中，人们都能看到学而思 AI lab 的活跃身影。基于智慧教育人工智能开放创新平台助力，学而思 AI lab 目前已获得各类顶级学术会议比赛冠军 16 项，亚军 6 项。

解决通用LLM“偏科”问题，数学大模型MathGPT要来了！

学而思 AI lab 在各类顶级学术会议比赛获奖情况。

在研究成果上，学而思 AI lab 在计算机视觉顶会以及自然语言顶会中均有多篇论文发表，共有国际期刊和会议高水平学术论文 31 篇，包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究。此外已申请专利 220 余项，授权专利 150 余项，软件著作权 60 余项。

「在 ChatGPT 出来之前，我们一直有团队在做自动解题这件事，几年下来已有一些积累，例如已经可以解大多数的计算题和部分应用题了。」在大语言模型火热以后，学而思 AI 团队发现，可以利用大模型提升对常识和题目文本的泛化理解能力。大模型的思维链可以增强对题目的分步推导和互动解答能力，再加上大模型和计算引擎的结合，解题的准确率和召回率可能会有较大提升。

这些技术成果的沉淀，我们也能在学而思已有的落地产品中窥见一二。

今年 2 月，「学而思学习机」上线了基于好未来自研 AI 技术的 AI 讲题机器人「小 π」。小 π 相关技术在 2020 年启动研发，以学而思超 3 亿的专业题库数据作为基础，主打数学等领域的 AI 智能讲题能力，核心优势在于数理逻辑和运算。

面对一道手写或者印刷的数学计算题时，小 π 不仅会对题目进行智能 AI 拆解分析，还能生成逻辑流畅、表达清晰的语言，将题目的解题方法讲解出来。有时，小 π 还会传授一些分数、小数等复杂计算甚至「凑数、组合」的巧妙算法。

在 ChatGPT 相关技术的启发下，学而思希望进一步实现学习机等产品的升级迭代，预期将在题目覆盖率、人机互动性、题目讲解生动性等方面实现大幅提升。比如，学而思学习机还将在不久后上线「AI 助手」。「AI 助手」涵盖作文助手、口语助手、阅读助手、数学助手等相关功能，计划于 5 月 11 日开启内测。

不止于「解题」的探索之路

如何利用大语言模型服务各行各业是当下社会的焦点问题。很多行业都可以直接与 OpenAI 合作，在 GPT 大模型上做微调和接口调用，增强原有的产品体验。

但像数学、医学等领域，对 AI 的需求是准确、清晰、具备强大的逻辑推理能力，且容错率低，通用 LLM 目前的性能表现还无法在上述领域取得突破。

具体到数学领域，目前市场上存在几个主要流派：

一种是利用非 LLM 的传统 AI 技术加上数据库的方式解决数学问题，比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品。

还有一种是 AGI 路线，即尝试让通用 LLM「更懂数学」，比如谷歌旗下的 Minerva 模型专门针对数学问题进行调优。此前，用户测试发现 GPT-4 在数学任务上相比其 3.5 版本有了明显的性能提升。尽管这种变化让人一度雀跃，但本质上只是模型接受了更多数据的训练 ——GPT-4 仍然不能保证计算结果的准确或给出清晰易懂的推理过程。

值得注意的是，学而思选择了另一条少有人走的路：不基于现有 LLM 做微调和接口调用、不做通用 LLM，而是自研基于专业领域的「数学大模型」MathGPT，致力于打造自主、稳定、可持续、高质量的学习解决方案。

在大语言模型不断进化的浪潮下，不同流派的技术路线选择孰优孰劣，仍有待讨论和验证。MathGPT 的表现如何，也将成为今年内人们非常关注的大事件之一。

至于未来应用，不难想象，MathGPT 最直接的落地方式之一就是成为 24 小时在线的「AI 教师」。学而思表示，初代版本的 MathGPT 将可以在教研助手、个性化学情分析、课后答疑、组卷助手等几个方面，辅助人类教师工作。从技术和产品的设计上，MathGPT 也会考虑到用户使用场景，通过有监督微调和强化学习的方式，不断改进性能，迭代版本。

再看长远一点，数学是很多应用问题的基础，也是众多科学问题的基础。如果一个大模型擅长于解决数学问题，那么它就有潜力去解决许多其他有用的问题，比如模拟行星轨道、原子运动、信号频率、蛋白质折叠等。

这些未来的探索，既取决于即将到来的 MathGPT，也和一方应用的进化、成熟度相关，更取决于各行各业的开发者如何运用好 MathGPT。

上一篇：2023成人高考有哪些热门专业好考？考哪几门课？

下一篇：智能化广受追捧未来哪些工作岗位会是“铁饭碗”

相关内容

怎么学？如何干？西藏7市（地）委书记在西藏日报发表文章

启航新征程开创新局面为全面建设社会主义现代化新拉萨努力奋斗自治区党委常委、拉萨市委书记普布顿珠党的二十大大笔擘画坚持以中国式现代化全面推进中华民族伟大复兴的宏伟蓝图，区党委十届三次全会全面铺开建设美丽幸福西藏、共圆伟大复兴梦想的壮阔实践···

2023年全区智慧旅游专业人才培训班圆满结业

6月2日，自治区旅游发展厅主办的全区智慧旅游专业人才培训班在拉萨圆满结业。培训共历时三天，累计完成全区旅游行政管理部门工作人员及涉旅企业专业技术人员培训100人。本次培训是区旅发厅深入推进学习贯彻习近平新时代中国特色社会主义思想主题教育重要···

徐汇萨迦共同举办大美西藏首届口腔学习班

随着现代医学的发展，口腔健康越来越受到人们的关注，为提高西藏地区口腔技术水平和服务质量，近日，徐汇区牙病防治所和萨迦县中心医院远程连线共同举办首届口腔学习班开班仪式。徐汇区卫生健康委副主任胡强，上海援藏干部、萨迦县委常务副书记、常务副县长沈···

自觉抵制“一对一”“一对多”等学科类培训！哈尔滨中小学生暑期预警来了

17日，记者从哈尔滨市各区教育局获悉，2023年暑假将至，南岗区、道里区、香坊区教育局向家长发出预警，自觉抵制违规培训，各区义务教育阶段学科类培训机构已经全部注销，暑假期间以任何形式开展的学科类培训均属于违规培训。家长要自觉抵制任何机构或个···

哈尔滨市道里区企投局举办“招商大讲堂”专题培训

黑龙江网讯（记者王惠婷）10月24日，哈尔滨市道里区企投局组织开展“招商大讲堂”专题培训班，全区各招商专班负责同志及业务骨干参加培训。本次培训从实际需求出发，紧紧围绕当前招商工作中的热点、难点，对“什么是招商引资”“道里区的产业结构和主导···

团黑龙江省委举办全省青年文明号青年岗位能手学习宣传贯彻党的二十大精神培训交流会

中国青年报客户端讯(李海涛)为深入学习贯彻党的二十大精神，充分发挥青年文明号、青年岗位能手示范引领作用，在全省职业青年中掀起学习党的二十大精神热潮，11月22日，团黑龙江省委举办全省青年文明号青年岗位能手学习宣传贯彻党的二十大精神培训交流会···

辽宁葫芦岛举办外贸政策培训会推动外贸保稳增量

辽宁省葫芦岛市外贸政策培训会4月3日举办。辽宁省贸促会供图中新网葫芦岛4月3日电 (李晛)辽宁省葫芦岛市外贸政策培训会4月3日举办。本次活动由辽宁省贸促会支持、葫芦岛市商务局主办，葫芦岛市贸促会、葫芦岛海关、中国出口信用保险辽宁分公司和辽···

山西运城：严查无证校外培训机构查封9家警告2家

新华社太原８月５日电（记者王飞航）记者从山西省运城市政府了解到，运城市教育局近日联合市公安局等多家单位，对中心城区无证校外培训机构进行了一次突击检查，共检查了１３家校外培训机构，查封９家，警告２家，发放整改通知书４份。今年７月，运城市教育局···

山西开展培训筑牢森林“防火墙”

山西新闻网3月30日讯（记者卢奕如）今日，记者从山西省应急管理厅获悉，全省举办森林草原防灭火业务培训，邀请专家以视频会议形式，围绕森林扑火指挥实操、森林草原火灾防控经验做法、火灾现场各级各类指挥员具体操作中遇到的问题等内容进行授课。培训内···

校外培训机构治理工作取得进展山西停办近1300所

资料图：小学生排队等待进入校园。中新社记者刘文华摄中新网5月11日电据教育部网站消息，按照校外培训机构专项治理工作整体安排，教育部、民政部、国家市场监管总局启动了校外培训机构治理专项督查工作。5月9日至10日，督查组率先在北京市开展华···

山西综改区举办省技术创新中心申报培训

　　8月18日，山西综改区科技金融部举办2023年度省技术创新中心申报培训会，来自区内企业、科研院所及有关单位代表160余人参加了培训。　　山西省技术创新中心是以产业前沿引领技术和关键共性技术研发为核心的产业技术创新平台，承担着为区域和产业···

山西汾阳医院开展健康教育与控烟知识培训

来源：【吕梁日报-吕梁新闻网】本报讯（记者刘少伟） 5月18日，在“世界无烟日”到来之际，山西汾阳医院组织开展健康教育与控烟知识培训。近年来，山西汾阳医院全面落实健康中国战略,根据国家卫健委《关于2011年起全国医疗卫生系统全面禁烟的决···

山西省文物局年度田野考古技术培训班开班

10月10日，山西省文物局在运城闻喜上郭城址、邱家庄墓群举办2023年度田野考古技术培训班开班仪式。该次培训为期三个月，通过理论和实践两部分教学，旨在推进山西考古工作高质量发展，提升考古业务人员专业技术水平。本次培训由山西省考古研究院和山西···

最低每课时9元！全省学科类校外培训课时长和收费标准出台

近日，山西省发改委、省教育厅下发《关于中小学学科类校外培训收费标准及有关事项的通知》，明确全省中小学学科类校外培训收费标准，从12月17日起执行。《通知》对全省线上线下学科类校外培训基准收费标准和浮动幅度制定了科学标准。其中，义务教育阶段线···

山西天镇阳光职业培训学校培养乡村“新农人”乡村振兴添动能

(记者贺文生) 山西天镇县阳光职业培训学校紧紧围绕乡村振兴战略，按照“政府引导、农民自愿、立足产业、突出重点”的原则，创新高素质农民技能培训方式方法，采取以“授人以渔”的方式，让人才振兴成为助推农业农村现代化的内生动力，以高素质农民引领现···

山西：建立全过程全链条无缝隙安全培训制度

黄河新闻网讯（记者杨江涛）日前，山西省应急管理厅下发了《山西省安全培训管理暂行办法》（以下简称《办法》）。我省将进一步抓好安全生产这个基本盘、基本面，推动全省安全培训工作制度化、规范化、科学化，促进安全培训工作高质量发展。山西省应急管理厅厅···

山西：艺考培训机构纳入全国监管平台管理

央广网太原10月6日消息（记者郎麒）日前，山西省教育厅、省发改委、省公安厅等部门联合制定《加强面向高中阶段学生艺考培训规范管理工作方案》，针对艺考培训的突出特点和实际情况，全面规范艺考培训行为，将艺考培训机构统一纳入全国校外教育培训监管与···

太平财险阳泉中支开展消防安全教育和有限空间作业培训

为强化员工安全意识，进一步提升员工消防和有限空间突发事件应急处理能力，9月14日，太平财险阳泉中支邀请北京市卫民安消防教育咨询中心山西分中心讲师向全体员工开展了一次消防安全教育和有限空间作业课程培训。按照防消结合、预防为主的原则，本次讲座通···

山西省数字化转型贯标试点工作宣贯培训会在太原举行

　　10月20日消息，山西省数字化转型贯标试点工作宣贯培训会在太原举行。省工信厅介绍，作为国家数字化转型贯标试点省份，试点启动后将引导企业加快数字化转型，助力制造业高端化、智能化、绿色化发展。　　今年，工信部启动数字化转型贯标试点工作，我省···

山西马兰花创业培训讲师大赛收官太原市获多个奖项

山西新闻网8月31日讯（记者冯耿姝）8月29日，山西省第四届马兰花创业培训讲师大赛圆满收官，太原市代表队在比赛中分获多个二、三等奖和优秀奖。本届大赛以“启迪创新思维·激发创业梦想”为主题，全省共有56名教师晋级复赛，其中，太原市有7名选手···

解决通用LLM“偏科”问题，数学大模型MathGPT要来了！

相关推荐

相关内容

友情链接