人民網
人民網

我國日均詞元調用量突破140萬億,企業為提升效率付費意願較強

小詞元撬動智能經濟大市場(大數據觀察·智能經濟新形態)

本報記者 王雲杉
2026年04月03日08:18 | 來源:人民網-《人民日報》
訂閱已訂閱已收藏收藏小字號

  數據來源:國家發展改革委、國家數據局
  制圖:沈亦伶

  頭條看點

  詞元(Token),大模型處理信息的最小信息單元。我國日均詞元調用量大幅增長,不僅折射智能經濟的澎湃活力,也意味著一套新型商業邏輯正在加速演進。智能時代,有了可計量、可定價、可交易的詞元,人工智能有望成為像水、電一樣支撐社會運轉的基礎資源。

  

  用戶端,查資料、寫代碼、改文案﹔企業端,金融風控、智能客服、代碼修正……如今,人工智能應用落地的每一個場景,都離不開對詞元(Token)的海量調用。

  詞元,大模型處理信息的最小信息單元。今年3月,中國日均詞元調用量突破140萬億,兩年增長超千倍。怎麼理解詞元?詞元和人工智能產業的關系是什麼,未來發展趨勢如何?記者進行了採訪。

  詞元調用量爆發性增長,背后是模型能力提升

  有人疑惑,詞元和常見的數據有何不同?

  “人工智能大模型的本質是一套復雜的數學運算系統,它無法像人類一樣直接讀懂文字、聽懂聲音、看懂畫面。”中國移動研究院網絡與IT技術研究所副所長唐華斌說,人工智能大模型必須先將各類原始數據轉化為自己能識別的“語言”,再通過運算輸出結果,詞元就是這套“語言”中最基礎的單元。

  具體來看,文字詞元像“樂高積木”,一個單詞或一個漢字被拆成一塊塊詞元﹔音頻詞元像“樂譜上的音符”,一段聲音被切成極短的時間片段,每一片包含音調、音量﹔視頻詞元像“拼圖碎片”,每一幀畫面被切成一個個小方格,並且還要考慮時間上的連續性……

  “在大模型看來,三種模態的詞元完全沒有差別。在模型眼裡,它不覺得自己是在讀文字或看視頻,它隻覺得自己是在處理一串極其復雜的數字序列。”火山引擎智能算法負責人吳迪表示。

  一個個基礎的詞元,構成了智能經濟運行的“細胞”。今年3月,中國人工智能大模型周詞元調用量連續3周佔據領先地位,成為全球大模型應用活躍度最高的國家之一。

  “詞元調用量爆發性增長,最直接的原因是模型能力的提升。每一次模型能力的提升,就會解鎖更多應用場景,從而使大模型詞元調用量進一步激增。”吳迪介紹,以Seedance(豆包視頻生成模型)2.0為例,生成1分鐘視頻大約會消耗超過100萬個詞元。

  同時,新的應用形態、新的商業模式,也會驅動大模型詞元調用量大幅上漲。唐華斌表示,最近興起的智能體和傳統單輪問答不一樣,它的運行往往意味著更長的上下文、更頻繁的模型調用、更多輪次的任務拆解,以及工具執行過程中的持續反饋。

  “簡單任務,如果隻需要單輪或幾輪工具調用就能搞定,消耗詞元隻需要幾千﹔如果需要幾十輪工具調用,則需要至少消耗幾萬詞元乃至更多。”吳迪說,智能體等新業態的涌現,讓詞元調用量又進入了一個快速增長的通道。

  詞元調用集中在信息密度高、迭代周期快的領域

  60億,是愛問答科技創始人李加義過去一年的詞元調用量。

  走進位於北京海澱區的AI原點社區,一間約16平方米的工作室裡,李加義團隊正在調試剛剛設計完成的AI玩具。

  “這個玩具要具備交互能力,離不開相應的軟件系統。放在以前,同等體量的軟件系統開發至少要半年,還得多人共同配合。”李加義說,在AI大模型與輔助編程的深度賦能下,消耗數億詞元,開發周期被壓縮至兩個月。

  2025年初,非計算機科班出身的李加義接觸AI輔助編程工具后,借助新技術打破了軟件開發的專業壁壘。“一年間,我們高效地完成了兩款APP和一個AI玩具的開發設計。前不久,我們還將自研的AI硬件產品推向了國際消費電子展(CES)。”李加義說,AI助力不僅讓開發成本大大降低,也讓小微企業的創新探索有了更多可能。

  軟件開發,是人工智能應用落地的典型場景之一。總體看,詞元調用量的分布呈現出鮮明的行業與場景特征,主要集中在那些信息密度更高、產品迭代周期更快以及模型與生產系統之間聯系更緊密的領域。

  以豆包大模型2.0為例,吳迪介紹,從行業分類看,互聯網行業詞元調用比例最高,消費電子、金融、新零售和商務服務緊隨其后。

  從場景來看,非結構化信息的處理和分析佔比最大﹔教育、內容創作和“搜索與推薦”次之。

  觀察未來的發展趨勢,軟件開發、深度研究、個人助理等智能體應用場景或將成為詞元調用量爆發的重要領域。“特別是軟件開發,當前人工智能正從簡單寫代碼轉向理解整個項目,不僅能排查錯漏、自動優化,甚至能通過智能體自主完成整個開發任務。代碼上下文長、交互輪次多,企業為提升效率的付費意願較強,這將成為一個巨大的需求增長點。”唐華斌說。

  詞元可計量,人工智能有望成為社會運轉基礎資源

  “今年1月底以來,有的模型企業創下20天收入超越2025年全年總收入的業績紀錄。這組數字背后,是一套以詞元計費為基礎的新型商業邏輯正在加速演進。”國家數據局局長劉烈宏表示。

  回顧人工智能產業發展歷程,過去一段時期,行業聚焦於模型性能的比拼,技術創新與商業落地之間缺乏可量化的銜接橋梁,難以形成“技術迭代—價值產出—持續投入”的良性循環。

  “詞元本身具備可計量、錨定算力能耗、跨模態通用結算的特點,使其能夠成為連接技術供給與商業需求的結算單位。打個比方,大模型輸出的智能好比電,智算中心好比發電廠,電用千瓦時來計量,智能調用就用詞元來計費。”聯想中國基礎設施業務群戰略管理總監黃山表示,展望未來的智能社會,人工智能有望成為像水、電一樣運轉的基礎資源,隨取隨用,用多少買多少。

  從詞元的視角出發,打造智能經濟新形態,我國有何優勢?有哪些發展著力點?

  算法創新持續實現突破,國產大模型通過底層架構優化,與全球頂尖技術的代差逐漸縮小。吳迪說,我國的大模型廠商做了非常多的算法創新,在推理成本、響應速度上不斷優化,能以更少的詞元完成復雜任務。

  基礎設施具備領先優勢。每生成一個詞元,都在調用數據中心的算力,伴隨著電力消耗。我國已建成全球門類最全、規模最大的能源體系,電源足、電網強、市場活。唐華斌表示,我國發電供給持續提升、電力成本不斷降低,能夠有效降低詞元調用成本。

  “能耗和算力是詞元調用的兩個關鍵成本。讓每個詞元用更少的算力和更少的能耗生產出來,體現的是智算中心等基礎設施的生產能力和效率。”黃山表示,要構建起安全、高效、普惠的人工智能基礎設施,持續提升大模型推理效率、降低單個詞元成本,讓人工智能最大程度走向規模化應用落地。

  《 人民日報 》( 2026年04月03日 06 版)

(責編:王郭驥、周雯)

分享讓更多人看到

2026年04月03日
06 版
返回頂部