首批通過!最高評級!學而思九章大模型通過中國信通院教育大模型評估
2024-06-27
隨著教育行業(yè)數(shù)字化轉(zhuǎn)型、智能化升級呈現(xiàn)加速發(fā)展態(tài)勢,教育大模型持續(xù)探索與教育各環(huán)節(jié)進行全面深度融合,全面賦能智能學習、智能教學、智能閱卷等各個核心場景。為推動產(chǎn)業(yè)健康持續(xù)發(fā)展,中國信息通信研究院(以下簡稱“中國信通院”)人工智能研究所聯(lián)合業(yè)界單位共同編制了教育大模型標準。
近期,在中國信通院組織的首輪教育大模型評估中,學而思“九章大模型”順利完成了教育大模型評估,獲得4+級證書,成為國內(nèi)首批通過該項評估并獲得當前最高評級的企業(yè)。教育大模型評估依據(jù)《面向行業(yè)的大規(guī)模預訓練模型技術(shù)和應用評估方法 第3部分:教育大模型》標準,共計3個能力域,6個能力子域,30余個能力項。標準聚焦教育行業(yè)核心需求,形成教育大模型應用成熟度評價方法,便于各方衡量教育大模型的應用能效,助推教育大模型產(chǎn)品升級優(yōu)化。
【學而思九章大模型介紹】
學而思九章大模型(MathGPT)是好未來自主研發(fā)的,以解題和講題算法為核心的大模型。九章大模型具有四大核心功能,即數(shù)學學科的自動解題、復雜應用題的批改,語文英語的作文批改,個性化的AI分步驟講題。大模型強大的生成、理解能力,既能針對性解決學生的個性化問題,從其不懂的題目映射出相應知識點,并加以補充講解,使得學生融會貫通,又能在內(nèi)置大量優(yōu)質(zhì)教學資源的同時,向更廣泛的學生普及。

圖1 學而思“九章大模型”界面
【評估介紹】
教育大模型評估指標覆蓋場景豐富度、能力支持度、應用成熟度三大維度,在促進產(chǎn)業(yè)發(fā)展、提升技術(shù)影響力和服務規(guī)范等方面具有重要作用。
(1)場景豐富度:關注教育大模型產(chǎn)品覆蓋廣度,包括學科支持度(數(shù)學、語文、物理、化學等)、場景支持度(知識檢索、知識問答、自主學習、測評考試等);
(2)能力支持度:關注教育大模型任務支持度和性能優(yōu)越度,包括計算、問答、分析、創(chuàng)作、總結(jié)等能力;
(3)應用成熟度:關注教育大模型安全性、學習性、啟發(fā)性、記憶性等,包括服務多樣性、服務成熟度兩個維度。

圖2 評估范圍
本內(nèi)容轉(zhuǎn)載自“可信AI評測”,https://mp.weixin.qq.com/s/WpT_IqDih-5pztuaGcq4MQ?scene=25#wechat_redirect