教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

投稿用戶 ? 2024年4月19日上午11:00 ? 科研百科 ? 閱讀 77

導(dǎo)讀 蘇喻博士，高級(jí)工程師，合肥人工智能研究院副研究員，原科大訊飛AI 教育研究院副院長(zhǎng)，中國(guó)科學(xué)技術(shù)大學(xué)博士后，安徽省青少年信息學(xué)教育專委會(huì)秘書長(zhǎng)，CCF 大專委-通訊委員，合肥市 D 類人才。蘇喻博士一直在智慧教育方向深耕，聚焦于青少年編程。面對(duì)數(shù)據(jù)稀疏和學(xué)習(xí)效果延時(shí)性問(wèn)題，蘇喻博士團(tuán)隊(duì)在教育領(lǐng)域大模型的研發(fā)中，技術(shù)上有如下三個(gè)方面的亮點(diǎn)：1）通過(guò)對(duì)偶數(shù)據(jù)的模型訓(xùn)練與評(píng)估和歷史經(jīng)驗(yàn)注入實(shí)現(xiàn)青少年編程垂類大語(yǔ)言模型；2）基于分層知識(shí)圖譜和推理 prompt 生成實(shí)現(xiàn)基于小知識(shí)的大模型學(xué)習(xí)；3）融合知識(shí)追蹤模型和大模型仿真的強(qiáng)化認(rèn)知推薦。產(chǎn)品應(yīng)用上，蘇喻博士團(tuán)隊(duì)開發(fā)了青蛙編程平臺(tái)、AI 編程學(xué)習(xí)機(jī)以及數(shù)字人 AI 錄播課平臺(tái)等。

本次的分享會(huì)圍繞下面五方面展開：

1. 智慧教育背景及挑戰(zhàn)

2. 教育領(lǐng)域大模型

3. 產(chǎn)品案例

4. 思考與展望

5. 問(wèn)答環(huán)節(jié)

分享嘉賓｜蘇喻博士合肥人工智能研究院副研究員

編輯整理｜王帥金山云

內(nèi)容校對(duì)｜李瑤

出品社區(qū)｜DataFun

背景及挑戰(zhàn)

1. 背景

蘇喻博士，2011 年 7 月至 2022 年 2 月就職于科大訊飛研究院，歷任科大訊飛 AI 教育研究院副院長(zhǎng)，AI 研究院認(rèn)知群教育條線負(fù)責(zé)人，學(xué)習(xí)機(jī)業(yè)務(wù)線教研總監(jiān)，重點(diǎn)負(fù)責(zé)教育領(lǐng)域個(gè)性化學(xué)習(xí)業(yè)務(wù)，包括個(gè)性化學(xué)習(xí)相關(guān)模型研究，產(chǎn)品設(shè)計(jì)，服務(wù)研發(fā)等，其研發(fā)的多項(xiàng)成果已經(jīng)成功應(yīng)用到訊飛智學(xué)網(wǎng)、訊飛智能學(xué)習(xí)機(jī)等相關(guān)產(chǎn)品中，于 2018 年獲得訊飛首屆華夏創(chuàng)新獎(jiǎng)，獲 2020 年吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步一等獎(jiǎng)。先后參與多項(xiàng)安徽省、部級(jí)等層面的重大項(xiàng)目科研工作，如國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目、科技部重大專項(xiàng)等。其間獲得多項(xiàng)發(fā)明專利，并在 AAAI、KDD、IJCAI 等國(guó)際知名學(xué)術(shù)會(huì)議與期刊發(fā)表文章近 30 篇，其中 CCF 推薦會(huì)議論文 A 類文章 7 篇，中文核心期刊論文 5 篇，SCI 檢索英文期刊論文 10 篇。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

（1）個(gè)性化學(xué)習(xí)

幾千年前，孔子提出因材施教的觀點(diǎn)，但受限于校內(nèi)大班教學(xué)現(xiàn)狀，傳統(tǒng)教學(xué)方案無(wú)法滿足學(xué)生的個(gè)性化需求。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

目前市場(chǎng)上的個(gè)性化教育產(chǎn)品呈現(xiàn)井噴的態(tài)勢(shì)，如科大訊飛的學(xué)習(xí)機(jī)、騰訊課堂、松鼠 AI（原易學(xué)）等，通過(guò)信息化及人工智能方法對(duì)學(xué)生能力進(jìn)行診斷，并給出推薦。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

（2）科大訊飛產(chǎn)品

科大訊飛學(xué)習(xí)機(jī)，自 2019 年開始發(fā)力至今成為頭部，主要提供給學(xué)生自主性、個(gè)性化的學(xué)習(xí)方案，節(jié)省學(xué)生時(shí)間，提高學(xué)生的學(xué)習(xí)興趣。平臺(tái)和教師通過(guò)學(xué)生在平板上的學(xué)習(xí)，分析學(xué)生的做題情況和能力水平，提供給學(xué)生一個(gè)個(gè)性化的知識(shí)圖譜，學(xué)生可依據(jù)該圖譜對(duì)薄弱知識(shí)點(diǎn)進(jìn)行自主強(qiáng)化學(xué)習(xí)。同時(shí)，學(xué)習(xí)進(jìn)展可視化，使學(xué)生可以了解每天的進(jìn)步情況，提升學(xué)習(xí)興趣。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

百度、作業(yè)幫等工具，針對(duì)考試錯(cuò)題，通過(guò)拍搜即可得到正確答案，這樣容易導(dǎo)致學(xué)生抄答案不再深入思考。而科大訊飛的個(gè)性化學(xué)習(xí)手冊(cè)是基于考試情況和錯(cuò)題，給每個(gè)學(xué)生推薦個(gè)性化的題目（無(wú)答案），同學(xué)間無(wú)法互相抄。此外，科大訊飛的產(chǎn)品對(duì)于試題有較好的表征，同時(shí)錯(cuò)題推薦更具科學(xué)性。

①試題表征

多模態(tài)資源理解，將包括文本、立體幾何圖像、音頻等在內(nèi)的試題獨(dú)立編碼到各自多模態(tài)的空間中。然后進(jìn)行多模態(tài)的語(yǔ)義對(duì)齊、self attention、Multi task 等工作。一道題的知識(shí)點(diǎn)、考點(diǎn)、難度作為其標(biāo)簽，這些信息全部映射為空間中的一個(gè)向量。傳統(tǒng)試題打標(biāo)簽需要人工完成，一方面人工費(fèi)高，另一方面主觀性強(qiáng)，一致率低。通過(guò)機(jī)器打標(biāo)簽可以提高準(zhǔn)確率。

②錯(cuò)題推薦

根據(jù)學(xué)生做的一道錯(cuò)題，通過(guò)一些相關(guān)的內(nèi)容和語(yǔ)義推薦類似的題目，一方面在雙減的情況下，學(xué)生更容易掌握錯(cuò)題相關(guān)的知識(shí)點(diǎn)；另一方面，教師可以針對(duì)上課中學(xué)生做錯(cuò)的例題，搜集到相似題目作為學(xué)生的課堂作業(yè)，提升備課效率。

③錯(cuò)題難度-最近發(fā)展區(qū)理論

基于教育心理學(xué)中的最近發(fā)展區(qū)理論，推薦簡(jiǎn)單的內(nèi)容，學(xué)生覺得無(wú)趣、浪費(fèi)時(shí)間；推薦太難的內(nèi)容，會(huì)使學(xué)生喪失信心。因此推薦題目的難度非常關(guān)鍵，應(yīng)是稍高于學(xué)生當(dāng)前水平，可通過(guò)一定時(shí)間學(xué)習(xí)達(dá)到目標(biāo)，感受到成就感，這樣才可以提升其學(xué)習(xí)興趣。

④實(shí)現(xiàn)方法-同分異構(gòu)學(xué)生錯(cuò)題

實(shí)現(xiàn)的方法是收集所有學(xué)生的答題記錄（百萬(wàn)級(jí)別，當(dāng)前到億級(jí)），放于教育認(rèn)證診斷模型中，將學(xué)生的信息映射到一個(gè)空間里，通過(guò)尋找目標(biāo)學(xué)生的同分異構(gòu)學(xué)生（水平類似，知識(shí)結(jié)構(gòu)有較小的差距），將同分異構(gòu)學(xué)生的錯(cuò)題推薦給目標(biāo)學(xué)生。這是基于假定——該類錯(cuò)題對(duì)于目標(biāo)學(xué)生更容易學(xué)會(huì)。

⑤解釋性及可視化-知識(shí)圖譜

針對(duì) C 端場(chǎng)景對(duì)于解釋性的需求，通過(guò)大量的學(xué)生數(shù)據(jù)，基于多模態(tài)的編碼，將學(xué)生的能力映射到一個(gè)知識(shí)圖譜上，為學(xué)生提供個(gè)性化的學(xué)習(xí)路徑，提升其學(xué)習(xí)效率和學(xué)習(xí)積極性。

圖譜的每一個(gè)節(jié)點(diǎn)代表知識(shí)點(diǎn)或知識(shí)點(diǎn)的組合
邊表征了知識(shí)點(diǎn)的前后繼承關(guān)系
顏色代表學(xué)習(xí)程度，如綠色代表學(xué)得好，紅色代表學(xué)得差，黃色代表學(xué)得一般。

學(xué)生基于該圖譜，可進(jìn)行一系列操作，如針對(duì)紅色的知識(shí)點(diǎn)，點(diǎn)擊后會(huì)出現(xiàn)一條設(shè)計(jì)好的學(xué)習(xí)路徑。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

（3）青少年編程

素質(zhì)教育-編程領(lǐng)域，學(xué)生對(duì)個(gè)性化學(xué)習(xí)的需求更多，難度更大。除了中小學(xué)生外，高校學(xué)生在上編程實(shí)驗(yàn)課時(shí)，也會(huì)遇到各種問(wèn)題，老師也會(huì)遇到無(wú)法針對(duì)每個(gè)學(xué)生的問(wèn)題一一解答的困境。青少年編程課程，無(wú)論是公立校還是教培，即使小班也會(huì)是 1 對(duì) 6，每個(gè)學(xué)生在每分鐘都會(huì)有其個(gè)性化的問(wèn)題（如調(diào)不通）等待老師回答。公立校中，老師會(huì)嘗試性將大部分同學(xué)搞不定的問(wèn)題的標(biāo)準(zhǔn)答案放于屏幕上，私立校會(huì)基于學(xué)費(fèi)和學(xué)時(shí)，重點(diǎn)支持解決問(wèn)題，但仍難以滿足個(gè)性化學(xué)習(xí)的需求。

①OJ 試題

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

此外，編程教育中會(huì)采用 OJ 試題，與傳統(tǒng)教育試題不同，會(huì)對(duì)題目有要求，OJ 試題的題面要求包含題目描述，規(guī)定了輸入輸出規(guī)范。一個(gè) OJ 試題包含多組用例，一個(gè)代碼用例由一個(gè)輸入和一個(gè)輸出組成，測(cè)試學(xué)生所寫的代碼是否符合預(yù)期。

②個(gè)性化編程平臺(tái)

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

個(gè)性化編程平臺(tái)包含代碼修復(fù)、代碼提示、輔學(xué)指引三部分。

代碼修復(fù)

學(xué)生寫完代碼后，基于大模型的認(rèn)知診斷，對(duì)代碼進(jìn)行修復(fù)，根據(jù)學(xué)生當(dāng)前的水平，給出代碼提示和步驟。

代碼提示

基于研發(fā)的底層編譯器，為用戶提供了中文 debug 界面，此外還會(huì)針對(duì)學(xué)生的基礎(chǔ)語(yǔ)法等彈出相應(yīng)的知識(shí)卡片。這樣可以解決用戶 80% 到 90% 的個(gè)性化問(wèn)題。

輔學(xué)指引

基于上述代碼提示，教師只需解決 10% 的共性難點(diǎn)問(wèn)題，有助于將編程學(xué)習(xí)順暢地進(jìn)行下去，提升學(xué)生的編程積極性。

2. 挑戰(zhàn)

（1）數(shù)據(jù)稀疏

當(dāng)前大數(shù)據(jù)的量很大，但數(shù)據(jù)稀疏。如平臺(tái)雖然存在海量的學(xué)生編程數(shù)據(jù)、答題數(shù)據(jù)，但對(duì)于某一個(gè)學(xué)生的記錄是有限的。如何根據(jù)學(xué)生在平臺(tái)做的幾道編程題，對(duì)其進(jìn)行很好的診斷，是一大挑戰(zhàn)。同樣，數(shù)據(jù)稀疏的挑戰(zhàn)也存在于其他領(lǐng)域，如醫(yī)療大模型，企業(yè)可獲得很多病人的案例，但平臺(tái)上某一個(gè)人的病例，可能只有一兩例。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

（2）學(xué)習(xí)延時(shí)性

針對(duì)學(xué)生的推薦，是否使其學(xué)習(xí)能力提升，能否通過(guò)編程等級(jí)考試，是無(wú)法即刻體現(xiàn)的。學(xué)習(xí)型的問(wèn)題，其推薦的收益不易監(jiān)控，學(xué)習(xí)效果會(huì)延后體現(xiàn)（可能很多天，甚至半年）。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

純 C 端的廣告推薦，相對(duì)更容易體現(xiàn)效果，推薦內(nèi)容后，是否點(diǎn)擊、購(gòu)買等都可以通過(guò)打點(diǎn)獲取到效果信息。

教育領(lǐng)域大模型

應(yīng)用大語(yǔ)言模型去輔助青少年編程，一方面依賴大語(yǔ)言模型的 NLG（Natural Language Generation）能力，可對(duì)提示做出連貫且符合上下文的文本回應(yīng)，另一方面憑借大模型的 Zero-shot 或 Few-shot 的學(xué)習(xí)能力，可以幫助理解新任務(wù)，并在最小提示和樣本下達(dá)到有利結(jié)果。此外，大語(yǔ)言模型也展現(xiàn)了強(qiáng)大的跨領(lǐng)域泛化能力。

針對(duì)數(shù)據(jù)稀疏或者個(gè)人真實(shí)數(shù)據(jù)較少的現(xiàn)狀，如何實(shí)現(xiàn) Zero-shot 能力？是否可以基于其他領(lǐng)域的知識(shí)，通過(guò)大模型實(shí)現(xiàn)泛化學(xué)習(xí)？團(tuán)隊(duì)就此開展了以下幾個(gè)工作：一是青少年編程垂類大語(yǔ)言模型，二是基于小知識(shí)的大模型學(xué)習(xí)，三是基于大模型的仿真強(qiáng)化認(rèn)知推薦。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

垂類大語(yǔ)言模型和小知識(shí)大模型主要解決數(shù)據(jù)稀疏性的挑戰(zhàn)，基于大模型的仿真強(qiáng)化認(rèn)知推薦解決收益閉環(huán)太長(zhǎng)的問(wèn)題。

1. 編程垂類大語(yǔ)言模型

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

編程垂類大模型構(gòu)建流程主要包括數(shù)據(jù)獲取、模型訓(xùn)練和知識(shí)注入三個(gè)步驟。

（1）數(shù)據(jù)獲取

通過(guò)對(duì)成熟優(yōu)秀的 LLM 提問(wèn)，讓其模仿孩子給出錯(cuò)誤代碼。在編程領(lǐng)域這種做法的一大問(wèn)題是，得到的回答可能經(jīng)常是一些簡(jiǎn)單的語(yǔ)法錯(cuò)誤，比如缺少一半括號(hào)，這對(duì)于編程領(lǐng)域大模型是沒有幫助的。

因此，我們構(gòu)建了生成數(shù)據(jù)鑒別器，來(lái)區(qū)分生成的數(shù)據(jù)和真實(shí)的數(shù)據(jù)。

同時(shí)，我們也通過(guò) Prompt 生成器，來(lái)自動(dòng)生成更為真實(shí)的指令。

最終，基于這樣兩個(gè)模型的對(duì)抗神經(jīng)網(wǎng)絡(luò)進(jìn)行錯(cuò)誤代碼生成，使得生成數(shù)據(jù)的分布與真實(shí)數(shù)據(jù)非常接近。

（2）模型訓(xùn)練（Fine Tuning）

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

在開源大模型 LLaMA 基礎(chǔ)上，通過(guò) Lora 微調(diào)生成代碼相關(guān)的垂類大模型，實(shí)現(xiàn)輸入錯(cuò)誤代碼，生成正確代碼。然而有時(shí)錯(cuò)誤代碼修正后，雖與標(biāo)準(zhǔn)答案很像，但仍存在一些邏輯上的錯(cuò)誤，無(wú)法通過(guò)測(cè)試用例。

因此提供了測(cè)試評(píng)估的接口，對(duì)答案進(jìn)行評(píng)分。整個(gè)微調(diào)有兩個(gè)監(jiān)督信號(hào)，本質(zhì)上有兩個(gè) loss，首先要求修復(fù)的代碼與標(biāo)準(zhǔn)答案很像，第二要通過(guò)測(cè)試用例，通過(guò)得越多，評(píng)分越高。這一工作，我們稱之為對(duì)偶數(shù)據(jù)，因?yàn)闃?biāo)準(zhǔn)答案和測(cè)試用例在本質(zhì)上是對(duì)同一事物的兩種描述。

（3）基于歷史經(jīng)驗(yàn)的知識(shí)注入

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

由于原始數(shù)據(jù)量不同，通過(guò)歷史經(jīng)驗(yàn)，將成功修復(fù)案例持續(xù)注入本地嵌入向量庫(kù)中，通過(guò)提示相似錯(cuò)誤解決的歷史經(jīng)驗(yàn)，提高模型修復(fù)的準(zhǔn)確率。

高質(zhì)量數(shù)據(jù)積累：現(xiàn)實(shí)中學(xué)生寫出的錯(cuò)誤代碼，基于報(bào)錯(cuò)信息修正后得到正確答案，這一系列真實(shí)數(shù)據(jù)作為歷史經(jīng)驗(yàn)持續(xù)注入知識(shí)庫(kù)中；
嵌入向量庫(kù)：將上述數(shù)據(jù)放入編程垂類大模型中，把大模型作為編碼器，將其轉(zhuǎn)為向量存放于一個(gè)嵌入向量庫(kù)中；
輸入信息增強(qiáng)：通過(guò)在線編譯器，將新的學(xué)生寫出的錯(cuò)誤代碼生成報(bào)錯(cuò)信息；
篩選排序，找到協(xié)同數(shù)據(jù)：在編碼后的知識(shí)庫(kù)當(dāng)中檢索與新學(xué)生的嵌入向量（原始問(wèn)題）類似的問(wèn)題，生成一個(gè)極為復(fù)雜的 prompt；
請(qǐng)求修復(fù)：將上述包含相似錯(cuò)誤解決歷史經(jīng)驗(yàn)的 prompt 輸入到大語(yǔ)言模型中，請(qǐng)求修復(fù)，提高修復(fù)的準(zhǔn)確率。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

如上圖測(cè)試了四個(gè)大模型—GPT3.5、LLAMA2、Vicuna-13B 和文心一言，經(jīng)過(guò)歷史經(jīng)驗(yàn)知識(shí)注入后嵌入式尋找協(xié)同數(shù)據(jù)，使得大模型的代碼能力較原來(lái)未采用知識(shí)注入的效果有較大的提升。

此外，以代碼修復(fù)為例，與 ChatGPT3.5 對(duì)比，經(jīng)過(guò)上述知識(shí)注入后微調(diào)的結(jié)果，在關(guān)鍵字錯(cuò)誤、分號(hào)缺失、括號(hào)不匹配、變量類型錯(cuò)誤等方面都有提升，平均提升 20%，大部分任務(wù)優(yōu)于 GPT3.5。

2. 小知識(shí)學(xué)習(xí)

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

在微調(diào)中，通常面臨如下的問(wèn)題：基于整理好的垂類領(lǐng)域數(shù)據(jù)，如 TB 級(jí)別的數(shù)據(jù)灌入到大模型中，但是大模型只能對(duì)已經(jīng)輸入的特定知識(shí)進(jìn)行回答，泛化一些的問(wèn)題，則完全無(wú)法給出答案。如何基于小的垂類知識(shí)，激活大模型相關(guān)能力？下面以知識(shí)問(wèn)答為例，介紹基于小知識(shí)的大語(yǔ)言模型學(xué)習(xí)。

多層知識(shí)體系：我們采用人機(jī)耦合方式構(gòu)建分層知識(shí)圖譜，下層為粒度細(xì)的知識(shí)點(diǎn)，上層為泛化的知識(shí)。利用大模型，自己挖掘節(jié)點(diǎn)之間的關(guān)系。

示例：二分查找怎么做？

知識(shí)查找：將二分查找問(wèn)題的關(guān)鍵點(diǎn)抽取出來(lái)，并映射到圖譜上，找到所有相關(guān)的分層圖譜，建立相關(guān)性連接；
推理圖構(gòu)建：在局部知識(shí)圖譜上進(jìn)行簡(jiǎn)單推理；
知識(shí)推理：基于圖將其變成一個(gè) prompt，并放入大模型中；

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

這樣，將二分查找的相關(guān)細(xì)節(jié)輸入到大模型中進(jìn)行微調(diào)，經(jīng)過(guò)微調(diào)的大模型更有機(jī)會(huì)激發(fā)得到正確的答案。

多輪迭代的大語(yǔ)言模型小知識(shí)學(xué)習(xí)

示例：學(xué)生問(wèn)循環(huán)累加哪里錯(cuò)了？

未調(diào)整前的 Prompt：直接問(wèn)循環(huán)累加怎么做，大模型給到的答案較敷衍，無(wú)法解決學(xué)生的問(wèn)題。
調(diào)整后的 Prompt：基于推理圖，給到更精準(zhǔn)的 Prompt。
基于 GPT4 進(jìn)行回答評(píng)分，調(diào)整前基本 10 道題有 6 道題答得不錯(cuò)，調(diào)整后 10道題會(huì)有 8 道題回答較好，有了大幅提升。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

知識(shí)注入后，大模型了解了概念，但是仍然無(wú)法回答問(wèn)題，原因在于 prompt 不夠好。通過(guò)模仿 prompt 工程師，可以有效提升大模型的效果。這樣解決了只是簡(jiǎn)單將語(yǔ)料給到大模型，大模型沒有辦法激活相關(guān)能力的問(wèn)題。

3. 強(qiáng)化認(rèn)知推薦

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

由于給學(xué)生推薦學(xué)習(xí)路徑的收益顯現(xiàn)歷時(shí)較長(zhǎng)，如何評(píng)判哪個(gè)學(xué)習(xí)路徑推薦更好呢？?jī)蓚€(gè)水平近似但知識(shí)分布不同的學(xué)生，推薦的學(xué)習(xí)路徑也應(yīng)不同。面對(duì)上述挑戰(zhàn)，我們采用了強(qiáng)化學(xué)習(xí)的方案，推薦模型即為 Agent，缺乏的環(huán)境通過(guò)大模型模擬生成，也即基于大模型的仿真強(qiáng)化認(rèn)知推薦。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

融合大模型和傳統(tǒng)深度知識(shí)追蹤模型，模擬環(huán)境的收益和狀態(tài)變化情況。

給出狀態(tài)，如推薦一道題后，學(xué)生狀態(tài)發(fā)生哪些變化。
推薦一道題后，基于領(lǐng)域的函數(shù)，得出其即時(shí)的收益。

學(xué)生的知識(shí)圖譜：

黃色：待學(xué)習(xí)的知識(shí)點(diǎn)
藍(lán)色：推薦學(xué)習(xí)知識(shí)點(diǎn)
綠色：已掌握知識(shí)點(diǎn)
紅色：未掌握知識(shí)點(diǎn)

通過(guò)大模型解決了沒有交互數(shù)據(jù)（即推薦學(xué)習(xí)后狀態(tài)和收益數(shù)據(jù)）實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)的問(wèn)題。

在原來(lái)比較小規(guī)模數(shù)據(jù)中，實(shí)現(xiàn)學(xué)會(huì)一道題，按照之前邏輯可能需要 9 步，通過(guò)當(dāng)前的方式，提高推薦能力，解決同一道題目，只需要更少的步驟。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

在中等知識(shí)點(diǎn)學(xué)習(xí)中，強(qiáng)化認(rèn)知推薦比普通的認(rèn)知推薦平均步驟下降了 30%，有更高的學(xué)習(xí)效率。

產(chǎn)品案例

1. 青蛙編程平臺(tái)

上述教育大模型，已集成于青蛙（找 bug）編程平臺(tái)和 AI 編程學(xué)習(xí)機(jī)中。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

青蛙編程平臺(tái)可以實(shí)現(xiàn) AI 自主學(xué)習(xí)，基于知識(shí)卡進(jìn)行智能交互式練習(xí)，更加輕松有趣。當(dāng)前已與多位名師、多家機(jī)構(gòu)合作，服務(wù) 2 萬(wàn) ＋學(xué)生，基于數(shù)據(jù)驅(qū)動(dòng)的教學(xué)更高效、精準(zhǔn)。

上述技術(shù)已經(jīng)發(fā)表 40 論文、10 專利。

2. AI 編程學(xué)習(xí)機(jī)

AI 編程學(xué)習(xí)機(jī)采用了墨水屏幕，無(wú)藍(lán)光，更護(hù)眼。

智能教輔示例：

學(xué)生：這道題怎么做？

大模型：給出一些提示

學(xué)生：基于提示還是不會(huì)做，怎么辦？

大模型：給出正確答案

學(xué)生：將正確答案抄寫后，編譯通過(guò)，但未通過(guò)測(cè)試用例

大模型：英語(yǔ)少了一個(gè)字母

學(xué)生：終于完成這道題目

智能教輔一方面解決了通常只能一對(duì)一才能解決的問(wèn)題，另一方面孩子自主完成題目，提升其自信心和學(xué)習(xí)興趣。同時(shí)可以讓教師集中精力解決共性的難點(diǎn)問(wèn)題。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

3. 智能云端編譯器

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

平臺(tái)中集成了青少智慧編譯器（智能云端編譯器），超過(guò)行業(yè)頭部品牌。

編譯器具有如下四大優(yōu)勢(shì)：

更輕便：云端免安裝，降低對(duì)硬件的要求
更智能：內(nèi)置青少編程大模型，可智能糾錯(cuò)
更專業(yè)：內(nèi)置各種編程環(huán)境，減少出錯(cuò)的問(wèn)題
更簡(jiǎn)單：編譯器漢化，降低調(diào)試的門檻。

4. 數(shù)字人 AI 錄播課平臺(tái)

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

錄播課通常為老師持續(xù)輸出內(nèi)容，學(xué)生可能無(wú)法長(zhǎng)時(shí)間專注。基于數(shù)字人的 AI 錄播課平臺(tái)，提供了個(gè)性化課程、智能化老師、精準(zhǔn)化練習(xí)。

虛擬老師可實(shí)現(xiàn)針對(duì)學(xué)生的問(wèn)題，實(shí)時(shí)回答，提高互動(dòng)性。
根據(jù)學(xué)生的歷史信息以及錄播課的情況、編程情況，可生成個(gè)性化編程題目，提高學(xué)習(xí)的趣味性。

如下為一段示例：

虛擬老師：如圖，目前公認(rèn)的在中國(guó)適用的 BMI 標(biāo)準(zhǔn)是：當(dāng) BMI 小于等于 18.4，說(shuō)明你的體重偏瘦。當(dāng) BMI 大于 18.4，小于等于 23.9，說(shuō)明你的體重正常。當(dāng) BMI 大于 23.9 且小于等于 28.0，就是過(guò)重。當(dāng) BMI 大于 28.0 就達(dá)到肥胖程度。

孟同學(xué)：為什么 BMI 大于 28 是肥胖而不是 27？

虛擬老師：BMI 大于 28 被定義為肥胖是基于大量的研究和統(tǒng)計(jì)數(shù)據(jù)得出的結(jié)論，這個(gè)標(biāo)準(zhǔn)是根據(jù)全球范圍內(nèi)的人群數(shù)據(jù)進(jìn)行分析得出的。不同的人群可能有不同的標(biāo)準(zhǔn)，但是 28 是一個(gè)被廣泛接受的標(biāo)準(zhǔn)。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

青蛙編程平臺(tái)以及數(shù)字人 AI 錄播課平臺(tái)，涵蓋優(yōu)質(zhì)的學(xué)習(xí)資源，可對(duì)標(biāo)行業(yè)頭部品牌，集成了智能云端編譯器，已經(jīng)超過(guò)行業(yè)頭部品牌，與金牌教練名師合作制作專屬AI 錄播課，打造私人專屬課堂。

思考與展望

1. 大模型 VS.“小模型”

大模型能力全面，但存在如下限制：

（1）計(jì)算資源需求大

高性能計(jì)算機(jī)、專用加速器（如 GPU、TPU 等）。
大量的存儲(chǔ)空間。

（2）訓(xùn)練時(shí)間長(zhǎng)

通常需要數(shù)天甚至數(shù)周的時(shí)間，需要高效的算法和硬件加速訓(xùn)練過(guò)程。

（3）不易定制

通常達(dá)到千億級(jí)別的參數(shù)才能實(shí)現(xiàn)特殊能力的涌現(xiàn)，不易定制。
垂類大模型做完后，到實(shí)現(xiàn)上線和 B 端機(jī)仍有很多工作要做。

中小廠的取勝之道，降低模型 size、做定制化、本地化。

利用網(wǎng)絡(luò)剪枝、向量量化、低秩近似等技術(shù)減少大模型的參數(shù)。
利用知識(shí)蒸餾等技術(shù)將大模型的特殊能力遷移到小規(guī)模網(wǎng)絡(luò)參數(shù)的模型。

2. 融入領(lǐng)域知識(shí)

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

在通用大模型上，小公司與大公司有較大的差距，但小公司基于小而美的專家團(tuán)隊(duì)，融入領(lǐng)域知識(shí)，結(jié)合知識(shí)圖譜，可以在垂類大模型上贏得先機(jī)。

3. “人工的智能”在于精細(xì)化的數(shù)據(jù)

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

“人工的智能”勝在垂類的精細(xì)化數(shù)據(jù)。中小廠做垂類大模型的商業(yè)模式，一定不是花錢做標(biāo)注，那將需要非常大的資金成本。中小公司可通過(guò)設(shè)計(jì)商業(yè)模式，讓用戶免費(fèi)“幫忙”標(biāo)數(shù)據(jù)。例如，我們有虛擬老師、自主編程平臺(tái)，孩子在完成代碼的修訂過(guò)程中，就是在幫忙標(biāo)記數(shù)據(jù)，隨著業(yè)務(wù)的推廣，數(shù)據(jù)飛輪效應(yīng)將逐漸顯現(xiàn)。

問(wèn)答環(huán)節(jié)

Q1：貴司的教育大模型是如何訓(xùn)練微調(diào)的？

A1：由于當(dāng)前很多大模型相關(guān)訓(xùn)練和微調(diào)的技巧未寫專利和論文，今日更多分享的是思路，用的還是通用的一些方法，如 SFT 等。

Q2：小知識(shí)學(xué)習(xí)中，客體知識(shí)多，但是單個(gè)用戶（主體）的知識(shí)很少的問(wèn)題，是如何來(lái)增強(qiáng)解決的？

A2：對(duì)于主體知識(shí)的補(bǔ)足，我們基于對(duì)抗神經(jīng)網(wǎng)絡(luò)，通過(guò)仿真生成更多的主體數(shù)據(jù)。例如，一個(gè)學(xué)生在平臺(tái)做了三道題，基于其他學(xué)生的題目，通過(guò)大模型仿真模擬學(xué)生做第四道題、第五道題、第六道題。同時(shí)基于對(duì)抗神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)模擬的題目與學(xué)生的真實(shí)水平一致。

以上就是本次分享的內(nèi)容，謝謝大家。

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

版權(quán)聲明：本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)，該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容，請(qǐng)發(fā)送郵件至舉報(bào)，一經(jīng)查實(shí)，本站將立刻刪除。

贊 (0)

投稿用戶

科技項(xiàng)目怎么查新（科技項(xiàng)目怎么查新聞報(bào)道）

上一篇 2024年4月19日上午10:55

技術(shù)開發(fā)委托合同范文（技術(shù)開發(fā)委托合同范文大全）

下一篇 2024年4月19日上午11:06

Thinkphp加Layui：已經(jīng)是遙遙領(lǐng)先的低代碼（thinkphp+layui）

簡(jiǎn)化代碼和提高開發(fā)效率是開發(fā)者們不斷追求的目標(biāo)。為了實(shí)現(xiàn)這一目標(biāo)，低代碼開發(fā)已經(jīng)成為了一個(gè)熱門的技術(shù)趨勢(shì)。其中，結(jié)合Thinkphp和Layui成為了一個(gè)受歡迎的組合，為開發(fā)者提…

投稿用戶
科研百科 2024年7月5日
320
外包用低代碼平臺(tái)嗎

外包用低代碼平臺(tái)嗎？隨著科技的不斷發(fā)展，企業(yè)在數(shù)字化轉(zhuǎn)型的過(guò)程中面臨著越來(lái)越多的挑戰(zhàn)。為了提高效率和降低成本，許多企業(yè)開始考慮外包軟件開發(fā)。然而，傳統(tǒng)的軟件開發(fā)過(guò)程通常需要耗費(fèi)大…

投稿用戶
科研百科 2024年3月3日
1010
創(chuàng)新機(jī)制管護(hù)好農(nóng)村基礎(chǔ)設(shè)施（創(chuàng)新機(jī)制管護(hù)好農(nóng)村基礎(chǔ)設(shè)施建設(shè)工作）

作者：拓兆兵近年來(lái)，在強(qiáng)農(nóng)惠農(nóng)富農(nóng)政策支持下，農(nóng)村基礎(chǔ)設(shè)施持續(xù)改善提升，越來(lái)越多的農(nóng)村實(shí)現(xiàn)水源凈化、道路硬化、夜晚亮化、能源清潔化，我國(guó)農(nóng)村面貌煥然一新。但我國(guó)農(nóng)村地域廣大，也有…

投稿用戶
科研百科 2023年10月5日
1950
項(xiàng)目進(jìn)度計(jì)劃管理體系

項(xiàng)目進(jìn)度計(jì)劃管理體系項(xiàng)目進(jìn)度計(jì)劃管理體系是一種管理項(xiàng)目進(jìn)度的方法，能夠幫助項(xiàng)目經(jīng)理和項(xiàng)目團(tuán)隊(duì)更好地規(guī)劃、組織和控制項(xiàng)目進(jìn)度。這種方法基于對(duì)項(xiàng)目范圍、目標(biāo)和需求的清晰理解，通過(guò)制定…

投稿用戶
科研百科 2025年1月14日
10
校園聯(lián)合科研項(xiàng)目

校園聯(lián)合科研項(xiàng)目隨著科技的不斷發(fā)展，我們?cè)絹?lái)越需要團(tuán)隊(duì)合作的力量來(lái)推動(dòng)項(xiàng)目的順利完成。因此，許多學(xué)校都開始了校園聯(lián)合科研項(xiàng)目，旨在促進(jìn)學(xué)術(shù)交流和科研合作。校園聯(lián)合科研項(xiàng)目是一種…

投稿用戶
科研百科 2025年2月10日
20
報(bào)建資源概述

報(bào)建資源概述報(bào)建資源是指為完成建筑物或其他工程所需的各種資源，包括土地、資金、設(shè)備、人力資源等。報(bào)建資源是建筑行業(yè)中非常重要的一項(xiàng)資源，對(duì)于建筑行業(yè)的發(fā)展至關(guān)重要。報(bào)建資源概述…

投稿用戶
科研百科 2024年10月25日
10
預(yù)算項(xiàng)目經(jīng)費(fèi)

預(yù)算項(xiàng)目經(jīng)費(fèi)：如何優(yōu)化項(xiàng)目預(yù)算預(yù)算項(xiàng)目經(jīng)費(fèi)是項(xiàng)目管理中至關(guān)重要的一部分。合理的預(yù)算項(xiàng)目經(jīng)費(fèi)可以幫助組織更好地控制成本，提高項(xiàng)目的效率和質(zhì)量。本文將介紹如何優(yōu)化預(yù)算項(xiàng)目經(jīng)費(fèi)，以確保…

投稿用戶
科研百科 2024年5月29日
420
科研百科

社群營(yíng)銷軟件有哪些？只要一個(gè)每域就足夠了（社群營(yíng)銷app有哪些）

隨著互聯(lián)網(wǎng)的不斷發(fā)展，在不知不覺中，社群營(yíng)銷儼然發(fā)展成了企業(yè)市場(chǎng)營(yíng)銷戰(zhàn)略的重要組成部分之一，是企業(yè)生存、發(fā)展、競(jìng)爭(zhēng)必不可少的策略與戰(zhàn)略。社群營(yíng)銷憑借其低成本高收益、高效的傳播速度、…

投稿用戶
2022年9月21日
6040
黨建引領(lǐng) 安全先行澧西街道安全隱患整改工作見成效（黨建安全隱患排查）

湖南法治報(bào)?新湖南客戶端訊（通訊員王華）近日，經(jīng)常路過(guò)207國(guó)道澧西段的群眾發(fā)現(xiàn)這個(gè)路段有了新變化，嶄新的安全護(hù)欄、減速帶、警示標(biāo)志等令道路煥然一新，保障了過(guò)往車輛安全通行，讓行…

投稿用戶
科研百科 2024年1月29日
1230
科研百科

erp電商管理軟件（電商erp軟件有哪些）

　　利：　　一、可對(duì)全業(yè)務(wù)過(guò)程進(jìn)行內(nèi)控。　　①在業(yè)務(wù)發(fā)生前，進(jìn)行預(yù)算控制將企業(yè)的整體目標(biāo)劃分為一小塊一小塊的，將每一小塊的內(nèi)容落實(shí)到相應(yīng)的部門和人員;進(jìn)行授權(quán)控制，建立企業(yè)內(nèi)部…

投稿用戶
2022年9月12日
4860

教育領(lǐng)域大模型技術(shù)與應(yīng)用（教育模型分為幾大類）

（1）個(gè)性化學(xué)習(xí)

（2）科大訊飛產(chǎn)品

（3）青少年編程

（1）數(shù)據(jù)稀疏

（2）學(xué)習(xí)延時(shí)性

（1）數(shù)據(jù)獲取

（2）模型訓(xùn)練（Fine Tuning）

（3）基于歷史經(jīng)驗(yàn)的知識(shí)注入

相關(guān)推薦