5月25日,主題為“數(shù)據(jù)要素賦能新質(zhì)生產(chǎn)力”的第七屆數(shù)字中國建設(shè)峰會(huì)數(shù)字福建分論壇在福州舉辦?!靶枪庵袊竟こ獭笨傊笓]、中國工程院院士鄧中翰應(yīng)邀出席,發(fā)表了“大模型時(shí)代的數(shù)據(jù)要素與應(yīng)用”的主題演講,他分享了“數(shù)據(jù)要素與應(yīng)用的必要性,建設(shè)我國數(shù)據(jù)要素與人工智能大模型的著力點(diǎn),數(shù)據(jù)合規(guī)開放共享的政策指導(dǎo)和措施,以及大模型時(shí)代下的數(shù)據(jù)安全保護(hù)問題等一系列具有重要指導(dǎo)性和建設(shè)性的觀點(diǎn)。
一,數(shù)據(jù)要素與應(yīng)用的必要性
大模型技術(shù)發(fā)展日新月異,探索空間從二維變成了三維,從文字生成衍生到視頻生成,海量數(shù)據(jù)成為大模型訓(xùn)練的剛性需求,優(yōu)質(zhì)的海量數(shù)據(jù)成為大模型公司爭搶的資源。中國的數(shù)據(jù)優(yōu)勢在于依托龐大的人口數(shù)量、完善的網(wǎng)絡(luò)和信息基礎(chǔ)設(shè)施和全球最大的生產(chǎn)體系,構(gòu)建了全世界最大規(guī)模、最豐富、最多樣性數(shù)據(jù)。
二,建設(shè)我國數(shù)據(jù)要素與人工智能大模型的著力點(diǎn)
近年來,國家相關(guān)部門發(fā)布“數(shù)據(jù)要素X”三年行動(dòng)計(jì)劃,提出12個(gè)重點(diǎn)領(lǐng)域,其中,科技創(chuàng)新部分:“支持開展人工智能大模型開發(fā)和訓(xùn)練”,從政策上為數(shù)據(jù)要素與人工智能大模型應(yīng)用提供了政策指引。
鄧中翰院士指出:海量數(shù)據(jù)是基礎(chǔ)優(yōu)勢,要實(shí)現(xiàn)從數(shù)據(jù)到數(shù)據(jù)要素的轉(zhuǎn)變。
1,要將原始未經(jīng)加工或分析的信息處理、整合成具有經(jīng)濟(jì)價(jià)值的、可被機(jī)器讀取并可供社會(huì)化再利用的數(shù)據(jù)資源。
2,對由組織合法擁有或控制的數(shù)據(jù)資源進(jìn)行主動(dòng)管理,形成能夠被廣泛應(yīng)用的具備經(jīng)濟(jì)意義的數(shù)據(jù)資產(chǎn)。
3,數(shù)據(jù)要素作為新型的生產(chǎn)要素,是參與到社會(huì)生產(chǎn)經(jīng)營活動(dòng)中,為所有者或使用者帶來經(jīng)濟(jì)效益的數(shù)據(jù)資產(chǎn)。
在應(yīng)用領(lǐng)域,鄧中翰院士認(rèn)為,專業(yè)大模型對于算力和數(shù)據(jù)要求低于通用大模型,市場化能力更強(qiáng),建議國內(nèi)企業(yè)后續(xù)可投入到專業(yè)大模型研發(fā)中,賦能各行業(yè)發(fā)展。
三,數(shù)據(jù)開放的政策指導(dǎo)和措施
針對公共數(shù)據(jù)開放性有限,企業(yè)間數(shù)據(jù)流動(dòng)性差等問題,相關(guān)部門在“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃中指出:“要加大公共數(shù)據(jù)資源供給,在重點(diǎn)領(lǐng)域、相關(guān)區(qū)域組織開展公共數(shù)據(jù)合規(guī)開放共享運(yùn)營,探索部省協(xié)同的公共數(shù)據(jù)合規(guī)開放共享機(jī)制。引導(dǎo)企業(yè)開放數(shù)據(jù),鼓勵(lì)市場力量挖掘商業(yè)數(shù)據(jù)價(jià)值,支持社會(huì)數(shù)據(jù)融合創(chuàng)新應(yīng)用。”
鄧中翰院士對公共數(shù)據(jù)的合規(guī)開放共享問題分享了自己的觀點(diǎn):要實(shí)現(xiàn)公共數(shù)據(jù)合規(guī)共享運(yùn)營機(jī)制還是很多具體的問題和困難。首先是收費(fèi)模式的探索。公共數(shù)據(jù)的資金來源是財(cái)政,理論上應(yīng)該有條件免費(fèi)使用公共數(shù)據(jù)。但要讓數(shù)據(jù)成為“能夠被識(shí)別和廣泛應(yīng)用的具備經(jīng)濟(jì)意義的數(shù)據(jù)資產(chǎn)”,還有很多的額外投入和具體工作,解決不好就會(huì)影響各部門合規(guī)開放共享數(shù)據(jù)的積極性。所以需要建立起面向企業(yè)和產(chǎn)業(yè)發(fā)展的公共數(shù)據(jù)有償使用機(jī)制,福建省是數(shù)字中國的先行省份,建議在這方面多做探索。
四,大模型時(shí)代下的數(shù)據(jù)安全保護(hù)問題
針對數(shù)據(jù)安全保護(hù)問題,鄧中翰院士提出,首先,應(yīng)落實(shí)數(shù)據(jù)分類分級(jí)保護(hù)制度,在確定涉及隱私和敏感信息范圍的基礎(chǔ)上,對包括視頻等在內(nèi)的數(shù)據(jù)進(jìn)行脫敏,以避免敏感信息在大模型訓(xùn)練過程中被泄露。
其次,應(yīng)深化對同態(tài)加密等技術(shù)的研究,使之能與大模型訓(xùn)練結(jié)合。在視頻智能分析領(lǐng)域,已應(yīng)用于人臉識(shí)別技術(shù)方案,可在不泄露人臉信息的情況下進(jìn)行比對;后續(xù)可考慮怎樣在大模型上應(yīng)用。
再次,應(yīng)探索可信執(zhí)行環(huán)境在大模型訓(xùn)練領(lǐng)域的應(yīng)用??尚艌?zhí)行環(huán)境提供隔離計(jì)算空間,可以確保數(shù)據(jù)在處理過程中的安全性和隱私性。對于企業(yè)間的訓(xùn)練數(shù)據(jù)共享非常重要。
最后,鄧中翰院士表示:我們正在探索一條有中國特色的數(shù)據(jù)要素應(yīng)用與安全平衡發(fā)展的道路,為數(shù)據(jù)要素在人工智能大模型時(shí)代充分發(fā)揮其效能保駕護(hù)航。
關(guān)于數(shù)字福建分論壇
作為數(shù)字中國建設(shè)峰會(huì)的重要組成部分,數(shù)字福建分論壇由福建省人民政府主辦,福建省數(shù)據(jù)管理局、數(shù)字中國研究院(福建)和福建省大數(shù)據(jù)集團(tuán)有限公司承辦,邀請相關(guān)領(lǐng)域兩院院士、知名學(xué)者、政府部門領(lǐng)導(dǎo)及企業(yè)專家共同參與,為新時(shí)代數(shù)字福建和數(shù)字中國發(fā)展建言獻(xiàn)策。