3月31日,教育部召開新聞發布會,介紹深入貫徹落實《教育強國建設規劃綱要(2024-2035年)》、推進語言文字信息化發展情況。
發布會現場
《教育強國建設規劃綱要》提出,要建設“新型國家語料庫”。教育部、國家語委和中央網信辦近日聯合印發的《關于加強數字中文建設 推進語言文字信息化發展的意見》提出到2027年初步建成國家關鍵語料庫。
在發布會答記者問環節,教育部語言文字信息管理司司長劉培俊介紹了新型國家關鍵語料庫的情況。他表示,加強新型國家語料庫建設,是落實教育強國建設規劃綱要、服務教育強國建設的重要任務,是建強國家關鍵語料基礎設施的重要舉措,是加強數字中文建設、推進語言文字信息化發展、推動語言文字高質量發展的基礎支撐,也是經濟社會信息化建設、數字化賦能和智能化發展的基礎要素。
總體考慮是“聚焦一關鍵、統籌兩手抓、夯實三基礎”進行整體布局、分步實施、務求實效。具體的部署安排,要堅持戰略牽引、需求驅動、應用為要,啟動實施國家關鍵領域語料庫建設計劃。
一是聚焦“需求”這一關鍵。在關鍵學科、重點行業、戰略區域、民生期待和社會急需領域,分批建設規范、安全、優質的國家關鍵語料庫。目前,教育部、國家語委已經支持建設了30余項關鍵領域的語料庫。
二是統籌 “夯實新基建”與“服務制高點”兩手齊抓。以建設語料基礎設施為新基建,服務大語言模型以及生成式人工智能等技術前沿創新應用的制高點。目前,教育部、國家語委已經支持布局了五個領域的自主安全可控大語言模型建設項目,下一步將根據需求穩步擴大建設范圍,提升建設成效。
三是夯實“機制、標準、人才”三個基礎。第一是逐步建立健全語料共建共享新機制,第二是研制語言資源、語言數據、基礎語料以及大語言模型的技術和管理標準,第三是依托高校研究機構推進多學科交叉融合,為語言科技、語料建設以及人工智能創新應用培養高素質人才。
來源:綜合整理自教育部介紹深入貫徹落實《教育強國建設規劃綱要(2024—2035年)》推進語言文字信息化發展情況新聞發布會
① 凡本站注明“稿件來源:中國教育在線”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式復制發表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:中國教育在線”,違者本站將依法追究責任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出于非商業性的教育和科研之目的,并不意味著贊同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯系。