亚洲天堂不卡,国产亚洲精品v,午夜97,av网站在线播放,999久久精品,久久久久久天堂,午夜欧美福利

國內多數AI模型訓練使用的中文數據占比已超60% — 新京報

時間:2025-11-30 17:05:43 來源:素昧平生網

據新華社消息,國內中文數據在國內AI大模型的多數的中訓練性能提升方面發(fā)揮著重要作用。國家數據局近日發(fā)布的模型數據顯示,目前國內多數AI模型訓練使用的訓練中文數據占比已經超過60%,有的使用模型達到80%。中文高質量數據的文數開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能快速提升。據占京報


國家數據局局長劉烈宏表示,比已我國人工智能的超新快速發(fā)展,與我國高度重視數據工作是國內密不可分的。作為人工智能發(fā)展的多數的中核心要素之一,數據在推動“人工智能+”過程中發(fā)揮著關鍵作用,模型高質量數據集的訓練建設至關重要。


“在人工智能時代,使用Token,文數也就是大家通常所說的詞元,是處理文本的最小數據單元,如同互聯(lián)網時代大家所說的‘流量’?!眲⒘液杲榻B,2024年初,我國日均Token的消耗量為1000億,到今年6月底,日均Token消耗量已經突破30萬億,一年半時間增長了300多倍,反映了我國人工智能應用規(guī)模的快速增長。


據介紹,截至今年6月底,我國已經建設高質量數據集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片),400PB的總量相當于中國國家圖書館數字資源總量的140倍左右。


人工智能模型的訓練也推動了數據交易需求的攀升。截至今年6月底,各地高質量數據集累計交易額近40億元,數據交易機構掛牌的高質量數據集總規(guī)模達到了246PB。


下一步,國家數據局將通過體系化布局持續(xù)推進高質量數據集建設,加快打造具身智能、低空經濟、生物制造等重點領域數據高地,推動全社會強化數據要素價值認同,加快推進數據要素價值共創(chuàng),培育“為優(yōu)質數據買單”的市場共識。


編輯 劉佳妮

來源:新華社
推薦內容
    颍上县| 荆门市| 三明市| 神农架林区| 九龙县| 清远市| 彭州市| 丰台区| 泗阳县| 贵州省| 剑阁县| 成安县| 金乡县| 九寨沟县| 嘉祥县| 静宁县| 泸西县| 霍邱县| 庐江县| 怀仁县| 杭锦后旗| 天门市| 房山区| 霞浦县| 手机| 合阳县| 汽车| 乌拉特后旗| 定西市| 晴隆县| 万载县| 临湘市| 沂南县| 刚察县| 肥乡县| 青神县| 绥宁县| 修文县| 通化市| 昌邑市| 嘉禾县|