人民網
人民網

武漢打造高質量數據集 點燃AI產業新引擎

2025年12月05日15:28 |
小字號

一家醫療科技企業憑借1400TB的宮頸細胞數據,讓宮頸癌篩查覆蓋全國31省2000余機構,三年創造數億元效益﹔一家醫院用2.45億張超聲影像“喂養”出全球首個超聲多模態大模型,AI診斷准確率達到高年資醫師水平﹔一家科技公司通過218TB的多模態精神健康數據,實現10秒快速篩查抑郁障礙,讓偏遠地區也能享受專業級心理健康服務……這些看似不相關的突破,都指向同一個關鍵詞——高質量數據集。

2025年的武漢,一場由數據驅動的產業變革正在悄然發生:以“數據燃料”點燃人工智能產業的引擎,讓數據從“資源”變為“資產”,從“沉澱”走向“增值”。

宮頸細胞AI輔助診斷高質量數據集技術架構圖。

宮頸細胞AI輔助診斷高質量數據集技術架構圖。

故事要從一份文件的出台說起。2025年初,《武漢市促進人工智能產業發展若干政策措施》出台,武漢市數據局廣泛征求意見印發全國首個聚焦高質量數據集建設的市級專項政策,明確了“建什麼、怎麼建、如何用”的路徑。

隨即一場覆蓋72家申報單位的“一對一”輔導鋪展開:工作人員帶著企業梳理數據資源、明確應用場景,走進武漢蘭丁智能醫學的生產車間、傳神語聯的翻譯平台、九州通的物流中心,實地考察數據應用的真實痛點。在武漢蘭丁智能醫學的實驗室裡,技術人員展示了他們的“秘密武器”——一個總量超1400TB的宮頸細胞數據集,裡面不僅有千萬級細胞圖像,還有超10億條細胞標簽和臨床元數據。“過去基層篩查缺病理醫生,我們就用數據‘補位’。”企業負責人介紹,通過“標准化採集—數據加工—模型訓練—安全質控”的全流程閉環,這套數據集支撐研發的4代智能篩查終端,不僅能自動識別異常細胞,還能通過雲端診斷系統連接三甲醫院專家,讓西藏山南等偏遠地區的7萬名婦女在家門口完成宮頸癌篩查,徹底打破地域限制。

億級多器官超聲影像人工智能高質量數據集四位一體建設框架

億級多器官超聲影像人工智能高質量數據集四位一體建設框架。

如果說蘭丁智能的故事展現了數據在醫療普惠中的力量,那麼華中科技大學同濟醫學院附屬協和醫院的“億級多器官超聲影像數據集”,則詮釋了數據如何推動技術革命。面對中國超聲醫師缺口大、基層資源不均的難題,協和醫院依托日均10萬份的異構超聲數據,啃下了“海量數據實時整合、安全脫敏、專家級標注”三塊硬骨頭:自研40余套設備協議實現統一脫敏,獲GDPR等保三級雙認証﹔用“AI初篩—雙醫生盲審—權威終審”的三級質控,完成45萬幅圖像的精准標注﹔最終整合百萬例患者、2.45億張影像,融合10余家三甲醫院及13國公開數據,建成20余個高價值專病庫和200余個標准化AI數據集。基於這些數據訓練出的全球首個超聲多模態大模型UltraUnion,不僅能精准診斷70余種疾病,還催生了全球首台具身智能超聲機器人,實現甲狀腺、肝臟等6部位的“掃—檢—診”全自動操作,目前正在三甲機構進行臨床驗証。“數據讓我們的AI從‘實驗室’走進‘手術室’,更讓基層醫院有了‘專家級’的診斷能力。”醫院項目負責人說。

抑郁障礙人群體征高質量數據集建設框架。

抑郁障礙人群體征高質量數據集建設框架。

數據不僅能治病,還能“治心”。武漢東湖大數據科技股份有限公司的“抑郁障礙人群體征高質量數據集”,就用218TB的多模態數據破解了傳統精神健康篩查的“主觀難題”。不同於依賴問卷的傳統診斷,該數據集融合面部視頻、動態光譜和生物信號,通過非接觸式採集技術,構建起“生理+行為”特征的預測模型,識別准確率較傳統方法顯著提升,10秒即可完成快速檢測,篩查效率提高80%以上。如今,這套系統在校園裡守護學生心理健康,在企業裡降低事故率20%,更通過5G技術延伸至偏遠地區,讓曾經“看不見、摸不著”的心理問題有了“數據畫像”。“我們不僅建數據集,更建生態。”企業負責人介紹,數據集已聯動數據標注、智能硬件企業,形成“數據+技術+硬件”的協同產業鏈,帶動相關產業產值增長,讓精神健康服務從“被動治療”轉向“主動預防”。

這些企業的實踐,正是武漢高質量數據集建設的縮影。數據顯示,2025年武漢聚焦工業制造、醫療健康、交通物流等重點領域,組織多元主體建設超100個行業高質量數據集,發布第二批10個典型案例,總規模突破200TB,支撐50個AI模型及智能體開發,帶動產業投資約4.3億元,促進企業營收增長1.4億元。更令人振奮的是,武漢的“數據實力”已獲得國家級認可:3個項目獲批國家數據局專項資金支持,3個案例入選國家高質量數據集典型案例(副省級城市前列),26個數據集入選湖北榜單(佔比超72%),12個場景入選湖北省重點聯系服務示范場景清單,紫東太初公司的“賦能具身智能機器人智慧化訓練的高質量數據集”項目入選國家先行先試示范任務。

“高質量數據集不是‘數據倉庫’,而是‘創新引擎’。”武漢市數據局相關負責人表示,武漢將繼續發揮政策引領作用,發布專項建設任務,探索“高質量數據集創新試驗場”,聚焦光電子信息等特色產業打造示范場景,同時推進規范化評測,爭取更多國家、省級試點支持,讓更多“武漢數據”成為人工智能模型的“優質燃料”,為城市高質量發展注入更強勁的數字化動能。(圖/文 武數宣)

(責編:郭婷婷、周恬)

分享讓更多人看到

推薦閱讀
返回頂部