高質量數(shù)據(jù)集和AI共振 成為數(shù)據(jù)流通“硬通貨”
中新網北京9月2日電(記者 吳濤)當人工智能的浪潮席卷全球,其背后的“燃料”——數(shù)據(jù),正成為競相爭奪的戰(zhàn)略資源。然而,并非所有數(shù)據(jù)都能加速AI的發(fā)展。一場從“海量數(shù)據(jù)”向“高質量數(shù)據(jù)集”的變革正在發(fā)生。
何為高質量數(shù)據(jù)集?
2024年12月,國家發(fā)展改革委、國家數(shù)據(jù)局等部門印發(fā)《關于促進數(shù)據(jù)產業(yè)高質量發(fā)展的指導意見》,首次明確提出“高質量數(shù)據(jù)集”概念,支持企業(yè)面向人工智能應用創(chuàng)新,開發(fā)高質量數(shù)據(jù)集,大力發(fā)展“數(shù)據(jù)即服務”“知識即服務”“模型即服務”等新業(yè)態(tài)。
近日發(fā)布的《高質量數(shù)據(jù)集建設指引》指出,大模型參數(shù)規(guī)模指數(shù)級增長與多模態(tài)能力的拓展,數(shù)據(jù)需求從“量級積累”轉向“量質并重”。
官方數(shù)據(jù)顯示,截至2025年6月,全國建設高質量數(shù)據(jù)集超3.5萬個、總量超400PB;數(shù)據(jù)交易機構掛牌高質量數(shù)據(jù)集3364個,作為交易流通中的關鍵商品,累計交易額近40億元,規(guī)模達246PB。
在近日舉行的一場論壇上,中國信息通信研究院院長余曉暉表示,放眼全球,有大量的私域數(shù)據(jù),在場景、行業(yè)、政府中,這部分數(shù)據(jù)能夠釋放出來,是構成高質量數(shù)據(jù)集非常重要的一個方向。
高質量數(shù)據(jù)集和AI發(fā)展相輔相成
因為AI大模型的訓練會用到海量數(shù)據(jù),所以,市場一直有觀點認為,未來將無數(shù)據(jù)可用,或者不得不用大量的合成數(shù)據(jù)。在這種情況下,高質量數(shù)據(jù)集無疑成為數(shù)據(jù)流通的“硬通貨”。
清華大學數(shù)字政府與治理研究院院長、教授張小勁表示,人工智能大模型走到哪里,高質量數(shù)據(jù)集就走到哪里,反之,高質量數(shù)據(jù)集走到哪里,人工智能就走到哪里,這是相輔相成的,是雙輪驅動的格局。
中國工程院院士吳世忠指出,數(shù)據(jù)集建設的質量和安全,是大模型發(fā)展的生命線,要完善分級分類的數(shù)據(jù)安全制度,強化全流程的技術防護手段,筑牢防篡改的底層技術能力。在數(shù)據(jù)集建設中,還要主動融入中華優(yōu)秀傳統(tǒng)文化,避免模型成為利己主義的工具。
目前高質量數(shù)據(jù)集建設如火如荼,深圳市政務服務和數(shù)據(jù)管理局黨組書記、局長周劍明在國家數(shù)據(jù)局官網發(fā)文分享,深圳市結合公共數(shù)據(jù)資源授權運營和可信數(shù)據(jù)空間建設探索,支持高質量公共數(shù)據(jù)和企業(yè)數(shù)據(jù)等融合應用,已在征信金融、氣象、商保理賠等領域開展試點,取得較好成效。(完)

經濟新聞精選:
- 2025年09月02日 16:11:58
- 2025年09月02日 14:27:53
- 2025年09月02日 11:07:46
- 2025年09月02日 08:27:44
- 2025年09月01日 23:07:49
- 2025年08月29日 12:13:16
- 2025年08月27日 06:14:03
- 2025年08月27日 06:00:47
- 2025年08月26日 11:40:39
- 2025年08月25日 09:59:11