省直有關單位,各市、州、直管市、神農架林區(qū)數據管理部門、發(fā)展改革委、科技局、經信局、財政局、人力資源社會保障局、國資委:
現將《湖北省加快發(fā)展數據標注產業(yè)建設高質量數據集實施方案》印發(fā)給你們,請結合工作實際,認真組織實施。
湖北省數據局 湖北省發(fā)展和改革委員會
湖北省科學技術廳 湖北省經濟和信息化廳
湖北省財政廳 湖北省人力資源和社會保障廳
湖北省人民政府國有資產監(jiān)督管理委員會
2025 年11月10日
湖北省加快發(fā)展數據標注產業(yè)建設高質量數據集實施方案
為貫徹落實國家發(fā)展改革委等部門印發(fā)《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》,加快推進數據標注產業(yè)發(fā)展和高質量數據集建設,搶占人工智能發(fā)展制高點,現制定本方案。全省數據標注產業(yè)要以支撐人工智能發(fā)展為核心,堅持需求牽引、場景驅動、技術創(chuàng)新、繁榮生態(tài)協(xié)同推進,逐步實現“淺層標注”向“深層標注”轉變、“通用領域”向“垂直領域”拓展、“人工主導”向“人機智能協(xié)同”跨越。到2027年底,培育10家規(guī)模過億元的數據標注企業(yè),帶動相關產值超100億元,產業(yè)規(guī)模年均復合增長率達20%以上;力爭打造5個省級數據標注示范園區(qū)和10個省級數據標注示范基地,建設500個高質量數據集標桿產品,為加快建成中部地區(qū)崛起重要戰(zhàn)略支點集聚創(chuàng)新動能。
一、堅持需求牽引數據供給,做到數據可標
?。ㄒ唬┘涌灬尫殴矓祿Y源。深化公共數據資源資產化改革,持續(xù)推進清查盤點、確權確值、登記入賬和目錄編制,規(guī)范公共數據供給標準,梳理形成公共數據“一本賬”,構建全省一體化公共數據資源體系,打通數據共享開放和開發(fā)利用關鍵堵點。完善省市縣大數據能力平臺功能,更大力度推動公共數據開放、共享和授權運營。
?。ǘ┘涌齑龠M企業(yè)數據資源開發(fā)利用。實施“國有企業(yè)數據效能提升行動”,加速企業(yè)數據資產入表,力爭2026年底省屬國有企業(yè)基本建成數據資產管理體系。支持行業(yè)龍頭企業(yè)、平臺企業(yè)牽頭建設行業(yè)可信數據空間和行業(yè)級數據中心,統(tǒng)一數據采集標準,歸集產業(yè)鏈相關方生產過程數據,探索設立“數據貢獻積分制”,在保障數據安全的前提下推動產業(yè)鏈數據資源高效共享。支持各類公共服務平臺、行業(yè)服務平臺開設企業(yè)數據服務專區(qū),加大力度支持中小企業(yè)數據歸集、治理、開發(fā)和應用。
?。ㄈ┘涌焱苿涌蒲袛祿蚕砝?。支持行業(yè)主管部門牽頭,聯(lián)合高校、科研院所、重點實驗室等編制全省科研數據資源目錄,建立科研數據分級分類管理制度。對臨床研究觀察數據、工藝優(yōu)化實驗數據等非涉密、非敏感的科研數據實行開放共享;對涉及核心技術或隱私的科研數據實行授權使用。規(guī)范科研數據格式標準,重點服務科研大模型研發(fā)、基礎研究突破、關鍵技術攻關等需求。
?。ㄋ模┘涌鞂崿F數據資源跨領域、跨主體融合開發(fā)。構建供需對接精準、安全合規(guī)、流轉高效的數據流通交易服務體系,打造輻射長江流域、面向全國乃至境外的數據要素市場中部樞紐,促進各類數據融合開發(fā)。聚焦科學研究、工業(yè)制造、醫(yī)療衛(wèi)生、教育教學等行業(yè)領域需求,加快形成一批數據產品、服務和專題數據庫,滿足多元化數據資源需求。到2027年底,累計引育數商1500家以上,上架數據產品2000個以上。
二、多措并舉培育多元主體,做到數據能標
(五)推動人工智能企業(yè)圍繞自身需求開展數據標注。引導大模型研發(fā)、智能設備設計與制造等人工智能企業(yè),基于自身需求,開展標準化數據標注。支持企業(yè)圍繞多模態(tài)基座、政務辦公、行業(yè)出版、病理診療等大模型優(yōu)化升級,聚焦核心研發(fā)優(yōu)勢,輸出配套標注技術、工具及需求規(guī)范,促進數據標注與模型訓練雙向優(yōu)化。
?。┲С謹翟磫挝粐@價值提升開展數據標注。支持工業(yè)互聯(lián)網頂級節(jié)點、測繪、電力、醫(yī)療等數源單位,圍繞智能制造、智能駕駛、遙感測繪、醫(yī)療健康等重點領域需求,開展專業(yè)化數據標注與高質量數據集建設,推進多模態(tài)數據治理與價值釋放。建立健全覆蓋數據采集、清洗、標注、質檢的全流程治理體系,提升數據規(guī)范化水平與全棧支撐能力,激活數據要素價值。
(七)引導第三方標注企業(yè)深耕細分領域開展數據標注。引導第三方標注企業(yè)精準對接科技創(chuàng)新、產業(yè)轉型、社會治理、民生改善、消費提質等領域標注需求,開展多元化、多場景標注服務。推動企業(yè)加強專業(yè)領域標注團隊建設,研發(fā)專業(yè)化工具與技術,構建面向垂直領域的全流程解決方案,提升行業(yè)服務支撐能力。
(八)招引頭部企業(yè)圍繞優(yōu)勢產業(yè)開展數據標注。發(fā)揮光電子信息、汽車制造、醫(yī)療健康等優(yōu)勢產業(yè)及人才優(yōu)勢,吸引一批國內外頭部企業(yè)在鄂布局數據標注業(yè)務、設立區(qū)域總部或業(yè)務中心。推動頭部企業(yè)整合產業(yè)鏈資源,帶動本地標注企業(yè)加快技術升級與人才培養(yǎng),形成“頭部引領、中小跟隨、協(xié)同發(fā)展”的聯(lián)動效應。
?。ň牛┙ㄔO數據標注產業(yè)集聚區(qū)。推動武漢、襄陽、宜昌等地發(fā)展特色數據標注產業(yè),建成5個省級數據標注產業(yè)示范園區(qū)。加快人形機器人訓練場、智能數據標注中心等集聚化發(fā)展,建成10個領域聚焦、特色鮮明的省級數據標注產業(yè)示范基地。培育園區(qū)、基地產值規(guī)模超過10億元的不少于1家,超過5億元的不少于5家。
三、創(chuàng)新技術能力支撐,做到數據好標
?。ㄊ嵤╆P鍵技術創(chuàng)新應用。引導數據企業(yè)、科研院所圍繞數據集建設關鍵環(huán)節(jié),攻關具有自主知識產權的分詞器、數據嵌入、智能標注等關鍵技術。支持高校、科研機構、企業(yè)聯(lián)合研發(fā)多模態(tài)標注、質量評估等智能化工具。創(chuàng)新應用可信數據空間、區(qū)塊鏈、隱私計算等技術,探索“監(jiān)管沙盒”等數據安全應用模式。
?。ㄊ唬┩晟萍夹g標準體系。依托省數據標準化技術委員會開展相關標準起草、技術審查等工作,構建分層分類的數據標注標準體系,做好標準宣貫和推廣應用。鼓勵行業(yè)龍頭企業(yè)、高校、科研機構積極參與不同層級標準的編制修訂,支持電子信息、北斗遙感等行業(yè)領域“鏈主”單位牽頭制定行業(yè)標準和團體標準。
?。ㄊ┐罱▌?chuàng)新平臺載體。鼓勵高校、科研機構和企業(yè)創(chuàng)立數據標注和人工智能領域重點實驗室、技術創(chuàng)新中心、開源社區(qū)等,開展基礎研究和前沿技術探索。支持“鏈長”單位圍繞光電子信息、汽車、磷化工等優(yōu)勢產業(yè),整合鏈上企業(yè)、AI服務商、高校科研單位、金融機構等力量,組建人工智能攻關聯(lián)合體,推進科技成果轉化應用。
?。ㄊ﹦?chuàng)新數據標注模式。穩(wěn)步發(fā)展人工標注,創(chuàng)新發(fā)展人機協(xié)同標注和機器標注,形成以“專業(yè)場景人機協(xié)同、標準場景全自動”為主導的產業(yè)發(fā)展新模式。促進產學研用融合,圍繞醫(yī)療衛(wèi)生、交通運輸、政務服務、科學研究、文化旅游等垂域場景應用,創(chuàng)新基于專家專業(yè)知識的數據標注模式,推動數據標注從“人力密集型”向“知識密集型”轉型,加快發(fā)展高附加值標注產業(yè)。
四、加快打造體現湖北特色的高質量數據集,做到數據好用
?。ㄊ模┝⒆阈枨篌w系化布局。按照“需求導向、場景牽引、急用先行”原則,聚焦科學研究、工業(yè)制造、醫(yī)療衛(wèi)生、交通運輸、金融服務、教育教學、文化旅游、城市治理、信息服務、智慧康養(yǎng)等重點領域,動態(tài)發(fā)布高質量數據集建設清單,布局建設一批“產業(yè)數據+產業(yè)知識+人工智能”三位一體的高質量數據集。圍繞“51020”現代化產業(yè)體系建設,打造光電子信息、整車研發(fā)設計、空間智能、腦機接口、化工安全、智慧種養(yǎng)、工業(yè)母機、人形機器人、低空路徑感知與規(guī)劃等100個高質量數據集。聚焦重點場景需求,打造大規(guī)??缒B(tài)、出版融合、細胞病理、多語種語料、具身智能機器人等400個高質量數據集。
?。ㄊ澹┓诸愅七M專業(yè)化建設。推動“51020”產業(yè)“鏈主”企業(yè)聯(lián)合上下游單位,整合產業(yè)鏈數據資源,制定產業(yè)模型標注內容和規(guī)范,建設一批產業(yè)高質量數據集。依托重點行業(yè)牽頭單位,梳理形成應用場景、能力供給、數據需求“三張清單”,納入“數智+”場景育新行動,建設一批行業(yè)高質量數據集。鼓勵政府部門開放場景,與企業(yè)協(xié)同建設一批跨領域交互的高質量數據集。各市州要結合本地產業(yè)稟賦和資源優(yōu)勢,建設一批具有區(qū)域特色的高質量數據集。
(十六)全面加強設施化服務。建設省高質量數據集公共服務平臺,構建平臺、數據集、模型一體化服務設施,完善質量動態(tài)評價和供需智能匹配機制。推動省級平臺與全國高質量數據集管理服務平臺互聯(lián)互通,加快數據集跨區(qū)域流通。鼓勵應用企業(yè)、模型廠商、科研院所等聯(lián)合建設專業(yè)數據集創(chuàng)新應用平臺,面向重點行業(yè)提供數據集建設、應用、管理、運營等全鏈條服務,推動高質量數據集設施化、服務化、可評測。
?。ㄊ撸┓e極探索多領域應用。常態(tài)化開展高質量數據集案例征集發(fā)布,在為經濟發(fā)展賦能、社會治理增效、人民生活添彩等方面打造不少于100個可復制的數據集融合應用示范案例,加強典型推廣。建立“數據模型迭代”閉環(huán)機制,支持具身智能、低空經濟等模型訓練和推理,將通過驗證的大模型納入全省“AI工具箱”統(tǒng)一管理,優(yōu)先給予場景轉化支持,加速技術落地。
五、強化保障服務
?。ㄊ耍娀咧С?。依托省數字經濟發(fā)展領導小組辦公室,建立跨部門協(xié)同推進機制。支持相關企業(yè)和項目申報國家專項資金。將數據標注、高質量數據集建設科研攻關和技改提升項目,納入省級科技創(chuàng)新專項、制造業(yè)高質量發(fā)展專項支持范圍。支持打造一批數據標注產業(yè)集聚的標桿數字經濟園區(qū),對建設高質量數據集等績效靠前的給予最高500萬元獎勵。對省內企業(yè)新認定的國家級數字經濟領域優(yōu)秀產品、試點示范項目(含標桿、優(yōu)秀案例、揭榜掛帥等)一次性獎勵50萬元。
?。ㄊ牛┖粚嵠脚_支撐。依托省大數據能力平臺、省公共數據授權運營平臺、省數據流通交易平臺等搭建全省一體化數據資源供給體系基礎底座,圍繞數據采集、加工、標注、流通、利用等環(huán)節(jié),提供一站式服務。支持科研機構和企業(yè)布局建設一批技術中試平臺和概念驗證中心,加快建設人工智能數據訓練場。
?。ǘ┥罨a業(yè)合作。支持行業(yè)龍頭企業(yè)、科研單位牽頭組建數據標注產業(yè)聯(lián)盟,組織開展技術創(chuàng)新、供需對接和學術交流,推動模型企業(yè)、標注企業(yè)、高質量數據集建設單位精準對接資源。舉辦數據標注產業(yè)技術論壇、創(chuàng)新應用大賽、數字職業(yè)技術技能競賽等,營造良好發(fā)展生態(tài)。
?。ǘ唬┮龑I(yè)人才。引導高等院校、職業(yè)院校加強學科建設,開設數據治理、數據分析等專業(yè)課程;開展數據標注等職業(yè)認證,促進數據標注人才發(fā)展。在醫(yī)療健康、高端裝備、法律、金融等領域建立數據標注專家?guī)?,持續(xù)提升專業(yè)標注能力。
(二十二)加強金融服務。發(fā)揮政府引導基金和社會資本協(xié)同作用,支持數據標注、高質量數據集等優(yōu)質項目加快建設。創(chuàng)新金融服務模式,用好科技型企業(yè)知識價值信用貸、中小企業(yè)商業(yè)價值信用貸、“數易貸”等金融產品,進一步拓寬中小數據標注企業(yè)融資渠道。
