齊魯網(wǎng)·閃電新聞4月1日訊 近日,教育部、國(guó)家語(yǔ)委、中央網(wǎng)信辦共同印發(fā)了《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語(yǔ)言文字信息化發(fā)展的意見(jiàn)》,對(duì)加快推進(jìn)以信息化促進(jìn)語(yǔ)言文字事業(yè)高質(zhì)量發(fā)展,以數(shù)字化賦能語(yǔ)言文字更好服務(wù)現(xiàn)代化建設(shè)等,作出了全面部署。教育部在3月31日舉行的新聞發(fā)布會(huì)上對(duì)文件進(jìn)行全面解讀,介紹了全面推進(jìn)語(yǔ)言文字信息化發(fā)展有關(guān)情況。
教育部語(yǔ)言文字信息管理司司長(zhǎng)劉培俊在介紹推進(jìn)語(yǔ)言文字信息化發(fā)展和數(shù)字中文建設(shè)有關(guān)情況時(shí)表示,黨的十八大以來(lái),我國(guó)語(yǔ)言文字信息化建設(shè)持續(xù)加強(qiáng),有力服務(wù)科技自立自強(qiáng)。大幅度擴(kuò)充語(yǔ)言文字信息處理技術(shù)標(biāo)準(zhǔn)。會(huì)同有關(guān)部門(mén)推動(dòng)研制并發(fā)布了《信息技術(shù) 中文編碼字符集》等國(guó)家通用語(yǔ)言文字和民族語(yǔ)言文字信息化規(guī)范標(biāo)準(zhǔn)100多項(xiàng),為自然語(yǔ)言處理技術(shù)在人工智能、數(shù)字產(chǎn)品和信息產(chǎn)業(yè)領(lǐng)域的應(yīng)用創(chuàng)新奠定規(guī)范基礎(chǔ)。
清華大學(xué)、北京大學(xué)、哈爾濱工業(yè)大學(xué)等開(kāi)展了語(yǔ)言文字信息技術(shù)的深度研發(fā),促進(jìn)中文信息互聯(lián)互通。其中,北京大學(xué)王選計(jì)算機(jī)研究所建成了中華精品字庫(kù)。大規(guī)模構(gòu)建語(yǔ)言資源體系。建成了世界最大規(guī)模的語(yǔ)言資源庫(kù)和中國(guó)語(yǔ)言資源知識(shí)圖譜,多模態(tài)集成120多種語(yǔ)言和方言資源。大領(lǐng)域布局大語(yǔ)言模型技術(shù)應(yīng)用,聚焦關(guān)鍵領(lǐng)域的需求,試點(diǎn)建設(shè)了一批自主安全可控的大語(yǔ)言模型。其中,北京師范大學(xué)古漢語(yǔ)大語(yǔ)言模型等已上線(xiàn)。
高水平開(kāi)展普通話(huà)水平測(cè)試,全面實(shí)現(xiàn)從人工到智能的普通話(huà)測(cè)試方式轉(zhuǎn)變,制發(fā)電子證書(shū)9000多萬(wàn)份。廣東省建成全國(guó)首個(gè)普通話(huà)水平測(cè)試智慧考場(chǎng)。高標(biāo)準(zhǔn)建設(shè)語(yǔ)言學(xué)習(xí)資源。開(kāi)通國(guó)家智慧教育平臺(tái)語(yǔ)言服務(wù)欄目,建成國(guó)家通用語(yǔ)言文字學(xué)習(xí)平臺(tái),匯聚8000多項(xiàng)學(xué)習(xí)資源,打造中華經(jīng)典資源庫(kù)、中小學(xué)語(yǔ)文示范誦讀庫(kù)等。高起點(diǎn)規(guī)范數(shù)字空間語(yǔ)言文字,發(fā)布《信息技術(shù)產(chǎn)品國(guó)家通用語(yǔ)言文字使用管理規(guī)定》,規(guī)范信息技術(shù)產(chǎn)品研發(fā),會(huì)同有關(guān)部門(mén)開(kāi)展“清朗·規(guī)范網(wǎng)絡(luò)語(yǔ)言文字使用”專(zhuān)項(xiàng)行動(dòng)。
多領(lǐng)域推動(dòng)語(yǔ)言文化資源共建共享。建成國(guó)家語(yǔ)委媒體語(yǔ)言語(yǔ)料庫(kù)、冬奧會(huì)多語(yǔ)言術(shù)語(yǔ)庫(kù)、公共服務(wù)領(lǐng)域譯寫(xiě)規(guī)范術(shù)語(yǔ)庫(kù)、規(guī)范標(biāo)準(zhǔn)課程庫(kù)等30多項(xiàng),多渠道打造示范平臺(tái)。上線(xiàn)國(guó)家語(yǔ)言資源服務(wù)平臺(tái)、中國(guó)語(yǔ)言文字?jǐn)?shù)字博物館、中國(guó)語(yǔ)言資源博物館數(shù)字展區(qū)等。指導(dǎo)各地各校開(kāi)展云端學(xué)習(xí)等課程平臺(tái)。多模式推進(jìn)傳承傳播。數(shù)字賦能讓收藏在博物館的文物活起來(lái),支持聯(lián)合開(kāi)展古文字?jǐn)?shù)字化研究,開(kāi)通甲骨文數(shù)據(jù)平臺(tái),傳承中華優(yōu)秀傳統(tǒng)文化根脈。
數(shù)字賦能讓書(shū)寫(xiě)在古籍里的文字活起來(lái),建成中華思想文化術(shù)語(yǔ)數(shù)據(jù)庫(kù),面向國(guó)際傳播1200多條反映中華民族話(huà)語(yǔ)體系中最核心最本質(zhì)的思想文化術(shù)語(yǔ),并與40多個(gè)國(guó)家和地區(qū)開(kāi)展多語(yǔ)種數(shù)字版權(quán)合作。已建成集成化、智能化、國(guó)際化的全球中文學(xué)習(xí)平臺(tái),用戶(hù)超1600萬(wàn)人,覆蓋190多個(gè)國(guó)家和地區(qū),深度化合作建立聯(lián)盟,中文學(xué)習(xí)聯(lián)盟云服務(wù)平臺(tái)提供3萬(wàn)門(mén)在線(xiàn)課程,與中外1600多家機(jī)構(gòu)合作,推動(dòng)實(shí)現(xiàn)中文人人、時(shí)時(shí)、處處可學(xué)可用、易學(xué)易用。
廣角度支持科研攻關(guān)。發(fā)布漢字簡(jiǎn)繁文本智能轉(zhuǎn)換系統(tǒng)、大語(yǔ)言模型評(píng)測(cè)技術(shù)等百余項(xiàng)科研成果。廣布局設(shè)置科研機(jī)構(gòu)。設(shè)立中國(guó)語(yǔ)言智能研究中心、多語(yǔ)種信息技術(shù)研究中心、語(yǔ)言技術(shù)與數(shù)字經(jīng)濟(jì)研究中心等,形成語(yǔ)言科技研發(fā)方陣。廣聯(lián)動(dòng)鼓勵(lì)成果轉(zhuǎn)化。支持有關(guān)高校聯(lián)合人工智能及信息服務(wù)領(lǐng)域頭部企業(yè),研發(fā)語(yǔ)言翻譯、智能語(yǔ)音、大語(yǔ)言模型等產(chǎn)品。
劉培俊表示,經(jīng)過(guò)多年努力,語(yǔ)言文字信息化以應(yīng)用為導(dǎo)向、以服務(wù)為主線(xiàn),形成了多語(yǔ)種資源廣泛開(kāi)發(fā)、多方面技術(shù)創(chuàng)新應(yīng)用、多類(lèi)型主體共同推進(jìn)、多維度賦能發(fā)揮作用的良好局面,有效服務(wù)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展。為搶抓大語(yǔ)言模型迭代升級(jí)新機(jī)遇、助力“人工智能+”新行動(dòng)、回應(yīng)經(jīng)濟(jì)社會(huì)發(fā)展新需求,《關(guān)于加強(qiáng)數(shù)字中文建設(shè) 推進(jìn)語(yǔ)言文字信息化發(fā)展的意見(jiàn)》明確提出,加強(qiáng)數(shù)字中文建設(shè)的理念、政策、行動(dòng)和項(xiàng)目,將數(shù)字中文建設(shè)作為服務(wù)數(shù)字中國(guó)建設(shè)的重要任務(wù)和全面推進(jìn)語(yǔ)言文字信息化發(fā)展的突出重點(diǎn),全方位釋放語(yǔ)言文字在經(jīng)濟(jì)社會(huì)發(fā)展中的數(shù)據(jù)要素價(jià)值,著力推進(jìn)中文數(shù)字化與數(shù)據(jù)中文化,著力推進(jìn)創(chuàng)新應(yīng)用與規(guī)范安全,著力推進(jìn)新型中文服務(wù)體系構(gòu)建與語(yǔ)言文字治理體系完善。
《意見(jiàn)》明確兩個(gè)發(fā)展階段,有序?qū)崿F(xiàn)2027和2035年語(yǔ)言文字信息化發(fā)展目標(biāo)。第一步到2027年,是以數(shù)字中文建設(shè)為重點(diǎn)的強(qiáng)基示范階段,形成語(yǔ)言文字信息化推進(jìn)機(jī)制,推動(dòng)語(yǔ)言文字信息化規(guī)范標(biāo)準(zhǔn)、前沿語(yǔ)言技術(shù)、優(yōu)質(zhì)語(yǔ)言資源、新型語(yǔ)言服務(wù)等基礎(chǔ)支撐能力顯著增強(qiáng)。第二步面向2035年,是全面推進(jìn)語(yǔ)言文字信息化發(fā)展的深化賦能階段,推動(dòng)承載中華文化的中文在全球數(shù)字空間、網(wǎng)絡(luò)空間以及生成式人工智能等關(guān)鍵場(chǎng)景中的使用占比和價(jià)值引領(lǐng)作用顯著提高,實(shí)現(xiàn)我國(guó)語(yǔ)言文字信息化整體水平位居世界前列。
《意見(jiàn)》部署三項(xiàng)重大任務(wù),統(tǒng)籌推動(dòng)技術(shù)創(chuàng)新、體系保障和關(guān)鍵賦能落地見(jiàn)效。創(chuàng)新應(yīng)用自然語(yǔ)言處理、大語(yǔ)言模型、多模態(tài)信息處理、知識(shí)圖譜、語(yǔ)料加工等五項(xiàng)前沿技術(shù),重點(diǎn)服務(wù)大語(yǔ)言模型等人工智能技術(shù)創(chuàng)新應(yīng)用“制高點(diǎn)”,夯實(shí)國(guó)家關(guān)鍵語(yǔ)料基礎(chǔ)設(shè)施“新基建”。系統(tǒng)建設(shè)語(yǔ)言文字規(guī)范標(biāo)準(zhǔn)、資源服務(wù)、人才培養(yǎng)、協(xié)同創(chuàng)新和安全治理五大保障體系,重點(diǎn)提升語(yǔ)言文字信息化的基礎(chǔ)能力。統(tǒng)籌實(shí)施數(shù)字中文服務(wù)教育發(fā)展、助力科技創(chuàng)新、賦能文化傳承、推動(dòng)產(chǎn)業(yè)升級(jí)、促進(jìn)社會(huì)進(jìn)步等五大賦能行動(dòng),重點(diǎn)推進(jìn)語(yǔ)言技術(shù)與關(guān)鍵領(lǐng)域需求深度融合應(yīng)用。