《經(jīng)濟學人》表示:當今世界最有價值的資源不再是石油,而是數(shù)據(jù)。數(shù)據(jù)的流動、疊加、匯聚可以滿足目前數(shù)據(jù)市場多樣化需求,實現(xiàn)數(shù)據(jù)價值最大化。尤其是人工智能再次崛起之際,大數(shù)據(jù)+人工智能將是產(chǎn)業(yè)創(chuàng)新發(fā)展最重要的工具與手段,缺少訓練數(shù)據(jù)的人工智能恰是巧婦難為無米之炊。
百度深知數(shù)據(jù)流動起來才會具有價值;為此,百度云推出百度數(shù)據(jù)眾包服務平臺,這是面向企業(yè)服務的一項能力,以“讓數(shù)據(jù)價值鏈暢通”為使命,推動數(shù)據(jù)價值普惠大眾。
百度眾包讓巧婦有“米”
在智能經(jīng)濟時代,擺在所有商業(yè)組織面前的難題是:如何獲取數(shù)據(jù),如何處理數(shù)據(jù)。來看一個真實的案例:某客戶需要大量高精度花卉類圖片,用于模型訓練、調優(yōu)、粗細粒度識別能力迭代等多種工作。初期圖片需求量大、涵蓋花卉品類繁多、數(shù)據(jù)處理需要耗費用戶大量的資源和時間成本;而現(xiàn)實情況是,該用戶自身并無能力快速完成數(shù)據(jù)的挖掘與處理,很難真正實現(xiàn)數(shù)據(jù)的價值,類似這種情況已成為普遍現(xiàn)象。
針對這一普遍性挑戰(zhàn),百度云為廣大企業(yè)用戶提供了百度數(shù)據(jù)眾包服務,該項服務使用低成本高效率的眾包模式來滿足客戶們對數(shù)據(jù)的需求:通過采集大量原始數(shù)據(jù)、并用數(shù)據(jù)標注對原始數(shù)據(jù)進行加工,最終提供計算機可識別的高質量數(shù)據(jù),從而為用戶的數(shù)據(jù)應用和業(yè)務創(chuàng)新奠定堅實的基礎。
百度數(shù)據(jù)眾包服務兩大核心功能是:數(shù)據(jù)采集和數(shù)據(jù)標注。數(shù)據(jù)采集包括文本、圖譜、語音視頻、O2O|LBS等數(shù)據(jù)的采集以及問卷調研,可以滿足用戶各種復雜場景數(shù)據(jù)采集的需求,且通過海量眾包用戶線下采集的方式,為客戶提供豐富的源數(shù)據(jù)。數(shù)據(jù)標注則包括數(shù)據(jù)的分類/清洗、數(shù)據(jù)校驗/評估、數(shù)據(jù)內容提取等,利用專業(yè)的標注團隊將源數(shù)據(jù)轉化為可用數(shù)據(jù),滿足用戶大規(guī)模的數(shù)據(jù)處理需求。
百度數(shù)據(jù)眾包平臺充分利用眾包模式的優(yōu)勢,通過技術和人力的規(guī)模效應為用戶提供低成本、高效率的數(shù)據(jù)服務,徹底解決用戶在數(shù)據(jù)采集和數(shù)據(jù)標注上的后顧之憂。百度數(shù)據(jù)眾包之所以能提供低成本、高效的數(shù)據(jù)服務,是因為有以下五大優(yōu)勢:
專業(yè)的眾包服務處理流程(且支持定制化開發(fā)):強大的平臺功能和多樣化基礎工具科學合理的作業(yè)流;專業(yè)項目人員全流程一對一跟進,實時掌控項目進度,保障了用戶數(shù)據(jù)需求的速度和質量;另外還可以為用戶量身定制特殊的采集、標注工具;
高效的數(shù)據(jù)處理速度:百度數(shù)據(jù)眾包服務采用的眾包模式具有強大的人力優(yōu)勢,覆蓋300+城市的萬名專職外場數(shù)據(jù)采集員、5000+在線標注人員、45種標注場景、100+核心專職數(shù)據(jù)處理專家可以滿足用戶所有廠家和數(shù)據(jù)量的需求,為用戶提供快速、高效的百萬級數(shù)據(jù)標注處理能力;
多重機制保障數(shù)據(jù)高質量:百度眾包服務擁有7年的數(shù)據(jù)行業(yè)積累,設置了多道數(shù)據(jù)質保屏障,確保數(shù)據(jù)質量的驗證和調優(yōu);比如,嚴格的人員培訓考核準入機制,多重數(shù)據(jù)人工審核質檢機制、人工智能輔助審核,數(shù)據(jù)質量遠高于行業(yè)水平;
全面和優(yōu)質的服務:百度眾包服務在需求接洽、方案設計、眾包執(zhí)行、質量保障、結果驗收,全流程均有專業(yè)項目人員實施跟進,為用戶提供更加全面和優(yōu)質的服務;
性價比出眾:成熟的眾包任務分發(fā)模式、易用的采集與標注終端工具,性價比首選;
此外,百度數(shù)據(jù)眾包服務提供數(shù)據(jù)公有化和私有化數(shù)據(jù)交付。客戶如果選擇公有化交付,只需在開放云直接提交需求或上傳待處理數(shù)據(jù),項目執(zhí)行完畢后,下載結果數(shù)據(jù),非常方便快捷;客戶如果選擇私有 化交付,則需要在公司內網(wǎng)部署數(shù)據(jù)客戶端,在公司內網(wǎng)批量提交需求并獲取結果數(shù)據(jù),數(shù)據(jù)隱私性更高。
百度眾包:數(shù)據(jù)服務經(jīng)驗深厚、應用場景豐富
百度眾包服務自成立以來,服務內外超過50+產(chǎn)品線/客戶,積累了深厚的數(shù)據(jù)服務經(jīng)驗,累計完成了5億張圖片標注,3億條文本、網(wǎng)頁類數(shù)據(jù)標注。百度眾包服務還擁有豐富的應用場景和大量成功案例,包括智能交通數(shù)據(jù)應用、電子商務應用、智能語音數(shù)據(jù)應用以及OCR數(shù)據(jù)應用等。下面是幾個經(jīng)典應用場景和真實案例:
某城市的交通要素的圖像識別。該項目需要對500000+張道路圖片進行內容實體標注,且標注的實體為多類型的交通元素,包括小汽車、客車、大貨車、行人、交通設施等,標注規(guī)則多達21項,識別類型多,操作復雜、精細度要求極高;通過百度數(shù)據(jù)眾包解決方案,該項目培訓了200+合格的標注員,日標注能力達到6萬框/天,數(shù)據(jù)質量高達99%;
某客戶的呼叫中心錄音數(shù)據(jù)轉寫與分析。某客戶的呼叫中心存在大量的客戶錄音數(shù)據(jù)需要進行轉寫和分析,包括語音角色判斷,語音內容切分以及語音內容轉寫,所有流程的操作復雜,且對數(shù)據(jù)因素和安全性要求極高;百度數(shù)據(jù)眾包為該客戶定制化了加密的語音播放器,且有專人進行審核和保障質量,實現(xiàn)了一次性交付。
一直以來,百度云都致力于構建以ABC(AI人工智能、BigData大數(shù)據(jù)、Cloud Computing云計算)基礎能力為核心的能力體系,以此來滿足廣大企業(yè)用戶不同的場景需求。百度眾包作為百度能力體系中的一員,將充分利用百度云綜合的科技能力,能夠很好地幫助企業(yè)用戶解決如何獲取數(shù)據(jù)、如何處理數(shù)據(jù)的難題,讓大眾真正享受到數(shù)據(jù)所帶來的價值。(本文來源:百度云微信公眾號)
下一篇
域名注冊和挑選應該注意這幾點