Search

阿里巴巴前副總裁:企業「養」數據的六大要點|天下雜誌 - 天下雜誌

擁有數據資源,將使企業擁有創新的可能性,並降低被淘汰的可能性,可以更好地適應高速變化的市場環境和用戶需求。但是,如何啟動是大部分企業的一個難題。阿里巴巴前副總裁傳授,企業的「養數據」的策略。

很多人把數據比喻為石油,但不同的是,數據來自應用,不管是否自覺,個人、企業,甚至每一部機器,時時刻刻都在貢獻並使用著數據。在不遠的將來,數據的應用會如同電力一樣,成為企業營運的必需品,滲透到企業的每一個業務環節。

隨著計算與儲存能力的增強,數據資源的供應將如同電力一樣不可或缺,為企業提供源源不斷的優化能力。

既然是核心資源,數據資產的營運就變得日益重要,對建立在數據基礎上的互聯網公司來說更是如此。盤點這些資源並不簡單,我在阿里工作時共做過三次,並歸納了一些經驗: 

• 什麼樣的數據用量大、覆蓋率高?—具公共屬性的數據。
• 什麼樣的數據稀缺、但重要?—具戰略性的數據。
• 重要數據不可再生,因此必須備份的數據。
• 數據資源用完可以再用!因為複製成本極低。
• 大數據的關聯特性,使得數據權屬的邊界變得越來越模糊。

幾次的資產盤點讓我認識到,數據的盤點與實物不一樣,數據可以無限衍生,而且,多並不代表有用。

對傳統產業來說,擁有數據資源,將使企業擁有創新的可能性,並降低被淘汰的可能性,可以更好地適應高速變化的市場環境和用戶需求,從而更具競爭力。可惜的是,傳統產業往往在資訊化和數位化建設方面存在缺失,彌補短處是當務之急,當然,這急切性往往與公司的經營方向相關。

無論是新興產業還是傳統產業,選擇人工智慧與大數據的切入點,場景尤為重要。在執行智慧專案時,必須考慮數據是否足以成為解決問題的要素,同時,場景的業務邏輯穩定性相當重要。

數據作為資產,能夠幫助企業更有效地進攻及防守。有效地創建、生產智慧工具及產品,強化客戶關係,預測客戶的消費習慣趨勢及流失,靠近並滿足消費者的需求。用大數據做行銷,已經是許多企業的常規性行銷手段,也就是利用數據加強對客戶的獲取、活躍、保留等服務能力。

在互聯網領域,數據的規模、活躍程度,以及收集、運用數據的能力,已經成為企業的核心競爭力之一。要深入洞悉市場、快速精準地找出應對策略時,數據已經成為企業實現更大商業價值的最強驅動力。當然,數據作為一種企業資產,需要與其他資產,如人力資源、硬體等相互組合,才能發揮出最大的價值。

大數據是來自多源異構的資料,「亂」是其特性,為避免出現無用輸入、無用輸出(garbage in, garbage out)的問題,在使用數據之前,需要對數據資產進行加工,從而帶來了「數據治理」這一重要課題。

大量、來源廣泛的數據,看起來往往是一團亂麻,我還記得,2013 年時,我當時的老闆淘寶網總裁三豐就跟我說過:「我們不能總坐金山吃饅頭。」企業採集和儲存 PB(千兆位元組)級別數據的成本卻是分文不少,而且有越演越烈的趨勢。一方面要治理數據資產,同時也要證明數據有大價值。

今天,數據的價值其實已無須再多言。開發 AlphaGo 而一舉成名的 DeepMind 團隊,被收購後,成功地幫助 Google 數據中心的冷卻系統節約用電 40%,未來幾年還將會幫助 Google省下數億美元支出,而據說,該專案僅有五、六個團隊成員。

難怪《人類大命運》(Homo Deus)的作者哈拉瑞(Yuval Noah Harari)認為,我們將會進入一個無機智慧(inorganic intelligence)的世界,未來,我們可能受演算法主宰。當機器具備深度學習的能力之後,人工智慧的定義有可能被改寫,人類的感知和普世價值也會改變,商業元素也將會發生巨變。就如我在《大數據的關鍵思考》一書中所說:未來,人與人之間的差別,拚的是他可使用的數據量和演算法。

企業「養」數據的六大要點

人工智慧因大數據而重生,但制約人工智慧在各領域實現更廣泛應用的,並不是演算法不夠先進,而是缺乏高品質的數據。若想開發最先進的機器學習技術,能否獲得高品質的訓練數據極為關鍵,而如何啟動是大部分企業的一個難題。對於從事機器學習研究的初創公司來說,起步時數據十分有限,難以建立起高品質的大數據資源。甚至有些企業在聘請數據科學團隊、購置昂貴的設備之後,才知道還未制訂「養數據」的策略。

數據來源的選擇必定與商業模式相關,我的經驗是,從小問題入手,弄清楚問題的本質,往往是選擇數據和演算法的前提。每家公司的數據獲取策略不盡相同,但回想這麼多年我在阿里也算面對了不少類似的困難,拋磚引玉與大家分享幾點:

要從零開始創建好的專有數據集,幾乎永遠意味著,要預先投入大量人力收集數據。但更痛苦的是,在業務變化的同時,數據結構也需要時時更新,正如前輩所說:「數據集成的同時已經在斷裂。」

即使表面上擁有很多數據,但在運用機器學習時,仍會發現數據量不足。你需要的數據量與你試圖解決的問題緊密相關。

數據的收集、處理、運用,短期來說肯定是越貼近業務越有效率,然而,從長遠看並不利於數據的標準化及重複使用,將導致開發週期變得漫長。我的經驗是,起點可以從最小化應用做閉環,基於眾多應用做長線規畫。

確保早期創造的應用有足夠的吸引力,讓業務方及使用者甘願交出他們的數據。讓大數據落地,除了關乎技術問題,亦繫於業務方及個人的意願是否足夠,只有互利互惠,才有長久合作。

在大範圍使用大數據之前,必須嚴肅地面對數據的標準和品質問題,否則後果堪憂。數據驅動型企業必須明白,數據品質是全部員工的責任,並不僅僅是技術問題。

大數據安全是一個命門,數據越多,責任越大,而且有時候會超出你的想像,原以為很安全的數據,拼合其他數據之後,可能成為機密級別。

我曾經對朋友說,我在阿里的數據治理過程可謂九死一生,很多人聽了不明白,看到上面的內容,再設想我要面對幾十個不同業務方的情境,你可能就了解了吧。

本文摘自天下雜誌出版《數據的商戰策略》

Let's block ads! (Why?)



"更是如此" - Google 新聞
March 21, 2020 at 05:10AM
https://ift.tt/2xgZN5H

阿里巴巴前副總裁:企業「養」數據的六大要點|天下雜誌 - 天下雜誌
"更是如此" - Google 新聞
https://ift.tt/2VUFiGf
Shoes Man Tutorial
Pos News Update
Meme Update
Korean Entertainment News
Japan News Update

Bagikan Berita Ini

0 Response to "阿里巴巴前副總裁:企業「養」數據的六大要點|天下雜誌 - 天下雜誌"

Post a Comment

Powered by Blogger.