近日,多家企业公布其大模型成果在教育领域的应用成果。短短两天内,网易有道、学而思、科大讯飞均透露了其在大模型领域的部分内容。其中,网易有道剧透其英文AI外教,学而思表示正在进行自研数学大模型的研发,科大讯飞则是发布“大模型+AI学习机”。
网易有道、学而思研发大模型应用新场景
5月5日,网易有道在其官方视频号发布了一段基于“子曰”大模型研发的 AI 口语老师剧透视频。在视频中,展示的“自定义对话场景”为雅思口语经典题目:“描述一位中国的名人”。进入对话界面后,AI 扮演的“雅思考官”可以主动用英文进行对话。
网易有道在评论区表示,“目前该产品仍在研发阶段,我们会持续打磨完善,争取在合适的时机尽快和大家见面。”
同天,学而思也表示正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,将于年内推出基于该自研大模型的产品级应用。
学而思透露,MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发,并且已启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。
学而思在其公告中表示,通用语言模型更像一个“文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足, “这种不足是由LLM模型的自身特点决定的,LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研MathGPT——数学领域大模型,用在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。”
据其透露,近期,学而思学习机也将会上线一款“AI助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该AI产品将于5月11日开启内测。
好未来集团CTO田密在其个人抖音账号上分享了通用大模型和领域大模型的观点,随后表示自己更支持领域大模型的观点,“一个大模型搞定一切的思路也许并不是最经济的解法,也许一个通用大模型作为交互接口,然后用toolformer的思路根据具体的任务去调用具体的模型获得结果,这种模型组合的方式性价比更高。”
科大讯飞演示“大模型+AI学习机”
5月6日,讯飞星火认知大模型成果发布,科大讯飞董事长刘庆峰、研究院院长刘聪现场实测大模型在长文本生成、跨语种语言理解、泛领域知识问答、逻辑推理、解答数学题、写代码等方面的能力,并发布教育、办公、汽车、数字员工四大行业应用成果。
其中在教育行业,科大讯飞演示了“大模型+AI学习机”的功能,包括批改作文,模拟口语老师实景对话。在作文批改上,搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文类人批改。相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。在口语对话方面,讯飞AI学习机掌握中英双语,孩子直接说中文后学习机能翻译成英文并教孩子朗读,还能对孩子的发音进行评分,以提升口语表达能力。
刘庆峰相信,这两项功能的升级将会促进语言学习再上一个全新的台阶,科大讯飞希望用“星火”点燃每一个孩子的想象力。
值得关注的是,在现场演示中出现了不少错误,包括逻辑推理题出错和语音输入识别错误等,对此刘庆峰表示这是真实演示的结果,讯飞星火每次给出的答案也会不一样,需要慢慢改进。
此外刘庆峰指出,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年会有明显的改进。同时他公布了年内大模型技术持续升级的三个关键里程碑节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。