中國網9月7日訊(記者 葛蕾)2021年中國國際服務貿易交易會(簡稱“服貿會”)近日在京舉辦。9月6日下午,國內領先的AI訓練數據頭部服務商云測數據,在服貿會成果發布現場進行了“云測數據標注平臺-AI數據集管理系統”的技術成果發布,展示了在數據資產已經成為企業核心資產背景下,云測數據基于行業前瞻和前沿技術服務積累,進一步拓展深化AI訓練數據價值的領先實踐。
本屆服貿會以“數字開啟未來,服務促進發展”為主題,由中華人民共和國商務部和北京市人民政府共同主辦,是全球首個國家級、國際性、綜合型服務貿易交易會,是服務業、服務貿易的展示窗口、交流平臺、合作橋梁。據了解,這是云測數據第二次在服貿會成果發布現場亮相,本次發布的“云測數據標注平臺-AI數據集管理系統”是繼去年發布“無數據 不AI,云測數據服務標準——項目最高交付精準度99.99%”基礎上的又一領先成果展示。
AI訓練數據處理流程全覆蓋
在AI產業鏈中,算法、算力和數據共同構成技術發展的三大核心要素。從AI產業鏈的發展情況和未來發展趨勢來看,中國AI數據服務行業的市場規模正在逐步擴大。一方面,隨著算法模型、技術理論和應用場景的優化和創新,AI產業對訓練數據的拓展性需求和前瞻性需求均快速增長;另一方面,隨著行業內對訓練數據需求類型的增加以及對服務標準要求的提高,產業鏈的專業化分工將愈加清晰,專業化的訓練數據服務提供商將扮演更加重要的角色。
作為我國領先的AI訓練數據頭部服務商,云測數據始終堅持以技術創新加速行業發展為己任,先后推出“數據場景實驗室”、“數據標注最高交付精準度99.99%”、“云測數據標注平臺”等產品與服務,為AI相關企業提供高質量、場景化的大規模處理感知數據的能力。
在2021服貿會成果發布現場,云測數據正式發布的“AI數據集管理系統”技術成果,是國內首個針對AI數據集管理的技術系統。展示了在數據資產成為企業核心資產背景下,云測數據基于行業前瞻和前沿技術服務積累,進一步拓展深化AI訓練數據價值的領先實踐。
云測數據 助力企業持續提升數據價值
人工智能落地商業化時代,企業面臨著自身AI數據量大,對某個特殊問題場景難找到有價值AI數據的普遍困境。同時在人工智能數據訓練過程中,AI數據管理更是面臨著數據資產不能充分利用、管理方式混亂、版本管理混亂等新的挑戰。云測數據標注平臺-AI數據集管理系統專注于Al數據集的上傳、管理、存儲、分享,數據類型標簽化管理,同時支持標注結果的存儲、標注結果可視化等功能,從而助力企業進行數據管理,提升數據訓練的匹配度,高效開展模型訓練,增強Al領域的核心競爭力。
作為 AI 技術的底層支撐,高質量的訓練數據越來越受到業界的重視。隨著人工智能深入自動駕駛、智慧醫療、智慧教育等諸多行業領域,AI算法對訓練數據維度和樣本復雜性的要求變得越來越高,對數據標注技術、標注平臺能力、不同維度數據協同標注等都提出了挑戰。
據國際數據公司(IDC)預測,中國的數據量增速最快,平均每年的增長速度比全球快3%。2018年,中國的數據量為7.6ZB,占全球總量的23.4%,預計到2025年將增至48.6ZB,占全球總量的27.8%,年復合增長率達30.35%。在這樣的數據增長背景下,數據資產管理的重要性不言而喻。
總得來說,越來越多的人工智能企業意識到高質量的訓練數據越多意味著AI落地應用效果越精準,但并不意味著所產生的價值越大,只有把海量的訓練數據進行有效管理,才能減少冗余數據、最大化地發揮訓練數據的價值,從而推動數據要素有序發展及高效利用。