在中小學普及人工智能教育不僅需要合適的工具和課程,還需要本地的人工智能教學平臺。各種人工智能實驗的開展,都需要借助特定的軟硬件環(huán)境支持。OpenHydra是在這一背景下推出的國產(chǎn)開源項目,用于搭建一個本地的人工智能教學平臺。本文分析了中小學人工智能教學平臺的核心功能,并介紹了在一臺算力服務器上快速搭建OpenHydra的過程,最后對OpenHydra項目提出了新的期望。
當數(shù)據(jù)、算法和算力被公認為是人工智能時代的三駕馬車時,這就意味著生物啟發(fā)式方法(搭建深度神經(jīng)網(wǎng)絡并在數(shù)據(jù)中獲取智能)已經(jīng)成為人工智能最重要的研究范式。中小學人工智能教育需要密切圍繞“模型”開展,不能僅停留在體驗和應用模型層面,還要嘗試收集數(shù)據(jù)并訓練、部署模型,在親歷“智能從無到有”的流程中理解模型。令人驚喜的是,隨著以Keras、XEdu為代表的人工智能學習和開發(fā)工具的出現(xiàn),學生只要借助少量代碼甚至不寫代碼就能訓練出人工智能模型。如果擁有合適的數(shù)據(jù),完全可以做到解決各種真實問題。
基于這樣的認識,筆者在建設學校人工智能實驗室的時候,申報了一臺擁有兩塊英偉達4090顯卡的算力服務器。經(jīng)過一段時間的研究,終于在開源項目OpenHydra的支持下,搭建了局域網(wǎng)版本的人工智能教學平臺,讓一個班級的學生共享服務器算力,借助瀏覽器即可完成常見的人工智能實驗。
中小學人工智能教學平臺的核心功能分析
大部分人工智能學習和從業(yè)者往往是借助商業(yè)云算力來開展各種實驗或者工作,但與高校不同的是,中小學人工智能教育往往在課堂上完成,對教學時間的把控要求比較高,而商業(yè)云算力并沒有提供適合中小學的容器(學習環(huán)境),用戶需要從零開始配置環(huán)境。最麻煩的是,在做深度學習實驗時還需要在服務器和本地之間傳輸大量的訓練數(shù)據(jù)。因此,商業(yè)云算力的方案對中小學來說并不適合,有條件的學校需要本地搭建內置算力的教學平臺,而這一平臺除了能夠提供教學資源和學生管理外,還能進行算力分割和學習環(huán)境管理,這是它的最核心的功能。
1.算力分割管理
雖然借助XEdu一鍵安裝包,在任何一臺win7以上電腦上都可以開展人工智能教學,但是訓練模型僅限于CPU環(huán)境,做對算力要求不高的機器學習和全連接神經(jīng)網(wǎng)絡的實驗。至于基于卷積神經(jīng)的圖像分類和目標識別實驗,沒有支持CUDA(NVIDIA推出的通用并行計算架構)的GPU設備,一節(jié)課很難完成教學任務。從性價比和維護難度看,買一臺算力服務器比為每一臺學生電腦配置GPU的做法要更合適。
需要強調的是,人工智能教育并不是針對少數(shù)人的高端課程,大部分學校的人工智能課是面向一個班級開展的。因此,用于教學的算力服務器需要支持30~40人的并發(fā)量。一般來說,一塊24G的顯卡一般可以切分為4份來使用,這樣一計算,支持一個班級至少需要2~4塊顯卡。即便如此,40人的班級還要分組,讓2~3人使用1個GPU容器,畢竟GPU設備太貴了。
2.學習環(huán)境管理
這里的“學習環(huán)境”指的是人工智能的開發(fā)和訓練環(huán)境。眾所周知,搭建環(huán)境能勸退90%以上想學習人工智能的人。因此,用Docker容器預先安裝好各種相關開發(fā)框架、工具和Python庫,成為一種通用的選擇,絕大多數(shù)的商業(yè)云算力平臺都選擇了內置Docker容器技術。所謂Docker容器,類似一臺無桌面系統(tǒng)的虛擬機,借助交互API,即可在瀏覽器上編寫代碼,在遠程容器上運行,再返回到瀏覽器上呈現(xiàn)。這個過程對學生用戶來說是透明的,與本地操作沒有區(qū)別。
目前,適合中小學生學習人工智能的環(huán)境有XEdu等。XEdu實際上是由MMEdu、BaseML、BaseNN和XEduhub等一系列Python庫組成的,涵蓋了Pytorch和sklearn等必備的人工智能學習框架。除此之外,Keras和PaddlePaddle也值得作為學習環(huán)境,完成一些特定的實驗。為了避免Python庫的版本沖突,這一平臺最好能支持多個容器。
用OpenHydra搭建人工智能教學平臺的過程
OpenHydra是一個開源項目,旨在為中小學AI教育提供一個開箱即用的學習與實踐平臺。它是基于K8S(全稱Kubernetes,一個用于管理容器的開源平臺)開發(fā)的系統(tǒng),默認內置了最新版本的XEdu。OpenHydra的開源地址:https://github.com/openhydra/。
1.服務器軟件準備
對于熟悉算力管理的高手來說,可以在K8S系統(tǒng)上直接安裝OpenHydra的插件。對中小學來說推薦使用編譯好的OpenHydra鏡像文件來安裝。只要將編譯好的ISO文件燒錄到U盤上,然后用這個U盤系統(tǒng)引導電腦啟動,即可一步一步完成OpenHydra系統(tǒng)的安裝。
2.啟動服務器并設置IP地址
全新安裝OpenHydra實際上包含了安裝Ubuntu(版本為server 20.04.06)和OpenHydra兩個環(huán)境。安裝過程類似對一臺新電腦安裝系統(tǒng),關鍵操作是設置IP地址、指定磁盤和用戶名。從系統(tǒng)引導開始計時,安裝時間預計20~30分鐘。需要強調的是,磁盤的數(shù)據(jù)要及時備份,安裝過程中會初始化磁盤。
3.測試教學平臺
在系統(tǒng)安裝完成后,重啟電腦后在顯示器上看到如下圖所示的信息,說明一切準備就緒,不需要再做任何操作,就可以開始上課了。
用其他電腦打開瀏覽器,輸入服務器地址和30001端口,如“http://192.168.3.233:30001”,就能看到OpnHydra的登錄頁面,如下圖所示。
教師在上課之前,首先需要配置學生賬號?!霸O備管理”頁面將列出所有的用戶登錄和使用情況。
對學生而言,在OpenHydra上打開實驗環(huán)境,將啟動jupyter頁面(如下圖)。
對OpenHydra的更多功能期待
經(jīng)過測試,OpenHydra的安裝和配置簡單,界面友好,很好地解決了算力分割的問題。但因為項目剛剛發(fā)布,還需要進一步完善。目前,OpenHydra社區(qū)匯聚了大量開源的AI開發(fā)工具和AI教學實踐項目,尤其期待多方力量的加入,讓這個系統(tǒng)能實現(xiàn)更多的功能。
1.支持更多的容器環(huán)境
如下圖所示,目前OpenHydra的內置容器只有XEdu標準版,還需要加入Keras、PaddlePaddle的容器。即使XEdu版本也應該有IOAI版本(AIO奧林匹克專用)、不同的教材版本等。甚至一些用戶數(shù)量較大的課程也可以封裝為一個獨立的版本。這些容器可以由管理員或者教師來手動更新,自由選擇。
2.支持在線更新課程資源
目前,OpenHydra團隊提供了課程模板,按照一定規(guī)范即可為這個項目提供標準課程。但是,人工智能的課程往往會內置特定的數(shù)據(jù)集,而深度學習的數(shù)據(jù)集都很多,少的數(shù)百張圖片,多的數(shù)萬張。那這些課程資源存放在哪里?如何更新?如果不設計在線增量更新的方式,肯定會限制后續(xù)的發(fā)展。
3.支持更多算力設備
眾所周知,GPU設備是最昂貴的。目前,一些國產(chǎn)的通用GPU設備也兼容CUDA,因為中小學的人工智能實驗不會追求最新的技術,往往會選擇一個最常用的計算框架版本,不需要實時更新。所以,只要做好一次適配,就能用較長一段時間。這個適配工作意義很大,但需要算力企業(yè)的支持。
4.支持各種教學插件開發(fā)
中小學一旦普及人工智能教育,各種需求就自然而然產(chǎn)生,如用戶通用認證、數(shù)據(jù)標注、作業(yè)評價、特定的教學活動支持等,這些功能應該以插件的形式吸引有能力的企業(yè)創(chuàng)客和教師開發(fā)。
總結
鐘柏昌教授提出,要開展中大型深度學習模型的訓練和部署,除了利用云服務器外,未來開展大規(guī)模常態(tài)化人工智能課程教學,離不開學校本地服務器的算力資源,而這種算力資源要同時滿足幾十上百個模型的同步訓練,又離不開算力資源的合理分割。人工智能的發(fā)展離不開教育,而教育需要更好的工具,OpenHydra項目不僅可以用于中小學,而且適用于一些規(guī)模較小的高校實驗室。因此,我們對OpenHydra項目的發(fā)展充滿了期待。
本文作者:
謝作如
浙江省溫州科技高級中學
文章刊登于《中國信息技術教育》2024年第07期
引用請注明參考文獻:
謝作如.用OpenHydra搭建本地人工智能教學平臺[J].中國信息技術教育,2024(07):74-76.
版權聲明:本文內容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。