從數(shù)據(jù)治理到機器學(xué)習(xí):業(yè)務(wù)智能的源動力

0 評論 1253 瀏覽 0 收藏 12 分鐘

在AI時代,企業(yè)管理者們迫切希望引入機器學(xué)習(xí)和人工智能來預(yù)測未來、自動決策。然而,許多企業(yè)在AI轉(zhuǎn)型中遭遇失敗,原因在于對“業(yè)務(wù)智能”的源動力把握不好。本文將探討數(shù)據(jù)治理和機器學(xué)習(xí)在構(gòu)建業(yè)務(wù)智能源動力中的關(guān)鍵作用。

企業(yè)管理在AI時代的焦灼不再是關(guān)于“上網(wǎng)”或“上云”,那些是上個時代的事情?,F(xiàn)在的企業(yè)管理者們迫切地希望引入機器學(xué)習(xí)(Machine Learning)和人工智能,試圖在存量博弈的市場中,找到某種能夠預(yù)測未來、自動決策的“超級動力”。

但當(dāng)我們把視角沉入企業(yè)內(nèi)部,卻是另一種景象:

花費巨資搭建的預(yù)測模型,跑出的結(jié)果與市場體感南轅北轍; 寄予厚望的智能營銷系統(tǒng),因為畫像混亂而淪為簡單的群發(fā)工具; 決策者手里握著所謂的“智能駕駛艙”,做決定時卻依然要靠打電話給一線確認(rèn)數(shù)據(jù)。

問題出在哪里?問題在于對“業(yè)務(wù)智能”的源動力把握得不好!

動力=燃料×引擎。

數(shù)據(jù)治理,是提煉燃料(源); 機器學(xué)習(xí),是燃燒做功(力)。忽視前者而迷信后者,這就是企業(yè)AI轉(zhuǎn)型中的“虛火”。

一、動力的斷層:當(dāng)AI引擎吸入“工業(yè)廢水”

值得記錄的一個事實是:絕大多數(shù)企業(yè)的AI項目,不是死在算法不夠先進上,而是死在“源頭污染”上。

在一家大型零售企業(yè)的AI轉(zhuǎn)型復(fù)盤會上,技術(shù)團隊展示了:

他們的銷量預(yù)測模型,在技術(shù)指標(biāo)上堪稱完美。但在實際應(yīng)用中,預(yù)測準(zhǔn)確率卻極其不穩(wěn)定。深究下去,原因令人啼笑皆非——在歷史數(shù)據(jù)中,促銷期間的銷量暴增,被系統(tǒng)原封不動地當(dāng)成了“自然增長”。因為在原始記錄里,沒有一個字段清晰地標(biāo)記“這筆訂單來自于促銷”。

在人的眼里,這是常識;但在機器眼里,這是它看不懂的干擾。

機器無法理解,為什么同樣的產(chǎn)品,上個月賣了1萬件,這個月只賣了100件。它只能得出一個結(jié)論:市場崩盤了。

這就是源動力的斷層。

企業(yè)試圖用機器學(xué)習(xí)這個精密的“內(nèi)燃機”,去驅(qū)動一輛裝滿了“工業(yè)廢水”(臟數(shù)據(jù))的賽車。結(jié)果必然是積碳、熄火,甚至爆缸??梢姡涸?strong>AI時代,數(shù)據(jù)不再僅僅是記錄,它是燃料。

以前做報表,數(shù)據(jù)稍微有一點偏差,人腦會自動修正,“這個數(shù)不對,應(yīng)該是錄錯了”。人有容錯機制。 但AI沒有。AI是直線思維的放大器。哪怕只有1%的數(shù)據(jù)是臟的,如果這1%恰好處于關(guān)鍵的特征項(比如客戶標(biāo)簽、庫存狀態(tài)),經(jīng)過AI模型的放大,最終輸出的決策建議可能會偏離100%。

所以,業(yè)務(wù)智能的第一定律是:沒有經(jīng)過治理的數(shù)據(jù),不具備產(chǎn)生智能的資格。

二、治理即提煉:重塑“源”的品質(zhì)

既然數(shù)據(jù)是燃料,那么“數(shù)據(jù)治理”就不應(yīng)該是IT部門被嫌棄的、需要打掃衛(wèi)生的角落,它應(yīng)該是企業(yè)的“煉油廠”。我們必須清晰定義數(shù)據(jù)治理在AI時代的價值坐標(biāo)。在傳統(tǒng)的IT視角下,數(shù)據(jù)治理是為了“合規(guī)”和“好看”。 在AI視角下,數(shù)據(jù)治理是為了“可計算”。

這包含三個提煉過程,也是構(gòu)建“源動力”的必經(jīng)之路:

1.語言的同軌(標(biāo)準(zhǔn)化)這是最基礎(chǔ)的提煉

如果銷售系統(tǒng)里的“客戶”叫Customer,財務(wù)系統(tǒng)里叫Account,物流系統(tǒng)里叫Receiver,機器就無法把它們關(guān)聯(lián)起來。它會認(rèn)為這是三個不相干的實體。 數(shù)據(jù)治理的第一步,就是強制性的“書同文”。這不僅是技術(shù)標(biāo)準(zhǔn),更是管理意志的體現(xiàn)。它要求業(yè)務(wù)部門必須在定義上達成共識,消除“方言”,統(tǒng)一“普通話”。

2.噪音的過濾(質(zhì)量清洗)這是純度的提煉

真實世界充滿了噪音:錄入錯誤、缺失值、重復(fù)記錄。未經(jīng)清洗的數(shù)據(jù)是原油,里面混雜著沙石。把原油直接倒進發(fā)動機是災(zāi)難。治理的過程,就是要把那些不合邏輯的(如庫存為負(fù))、不完整的(如缺失聯(lián)系方式)、不規(guī)范的數(shù)據(jù),在進入模型之前攔截下來或修復(fù)好。

3.關(guān)系的重建(資產(chǎn)化)這是高階的提煉

孤立的數(shù)據(jù)沒有力量。只有當(dāng)“人的行為”、“貨的狀態(tài)”、“場的場景”被關(guān)聯(lián)起來時,數(shù)據(jù)才變成資產(chǎn)。治理的核心任務(wù)之一,就是打通數(shù)據(jù)孤島,建立數(shù)據(jù)之間的血緣關(guān)系。

只有經(jīng)過這三層提煉,原本渾濁的數(shù)據(jù),才變成了高辛烷值的“航空煤油”。這時才剛剛具備了點火的條件。

三、機器即引擎:釋放“力”的效能

當(dāng)“源”被凈化,機器學(xué)習(xí)這個“力”的引擎,才能真正開始做功。要祛除對機器學(xué)習(xí)的神秘化想象。在業(yè)務(wù)智能的體系中,它不是算命的水晶球,它是“高維規(guī)律的萃取器”。

它的核心能力,在于突破人類經(jīng)驗的邊界。

資深的業(yè)務(wù)員也許能憑經(jīng)驗判斷:“下雨天,雨傘賣得好”。這是顯性的、線性的規(guī)律。 但機器學(xué)習(xí)能從治理好的海量數(shù)據(jù)中,發(fā)現(xiàn)隱性的、非線性的規(guī)律。比如:“在氣溫下降5度且伴有三級風(fēng)的周五下午,寫字樓附近的便利店里,熱咖啡和巧克力的組合銷量會提升20%?!?/p>

這種顆粒度的洞察,人腦無法計算,但機器可以。

這就是源動力的爆發(fā)點。

數(shù)據(jù)治理提供了“高保真”的輸入,機器學(xué)習(xí)提供了“高倍數(shù)”的計算。

  • 因為治理,我們確信“庫存數(shù)據(jù)”是實時的、準(zhǔn)確的(源);
  • 通過模型,我們預(yù)測出“未來三天如果不補貨,缺貨概率是85%”(力);
  • 最終形成行動:系統(tǒng)自動觸發(fā)補貨指令(業(yè)務(wù)智能)。

你看,這才是完整的源動力閉環(huán)。 如果去掉前半段的治理,模型算出來的缺貨概率可能是虛假的;如果去掉后半段的模型,治理好的數(shù)據(jù)也只是靜靜地躺在硬盤里,無法轉(zhuǎn)化為行動。源與力,互為因果,不可分割。

四、尋找“最小阻力面”

邏輯通了,但落到執(zhí)行層面,依然困難重重。我看到很多企業(yè)在AI轉(zhuǎn)型中陷入泥潭,往往是因為想一口吃成個胖子。要么試圖搞“全域數(shù)據(jù)治理”,耗時兩年沒產(chǎn)出;要么想搞“全自動AI決策”,步子太大扯到了蛋。

構(gòu)建業(yè)務(wù)智能的源動力,需要尋找“最小阻力面”。

1.場景倒推,而非全量治理

不要為了治理而治理。先問業(yè)務(wù)一個問題:當(dāng)前最痛的決策盲點是什么? 如果是“備貨不準(zhǔn)”,那就只治理與“商品、庫存、銷量”相關(guān)的數(shù)據(jù)域。集中兵力,把這口井打穿。 用一個高價值場景(如降低庫存周轉(zhuǎn)天數(shù))的成功,來證明數(shù)據(jù)治理的價值,從而獲得老板的支持和業(yè)務(wù)的配合。

2.人機協(xié)同,而非機器替代

在源動力體系建立的初期,不要指望AI能全自動駕駛。數(shù)據(jù)難免有瑕疵,模型難免有幻覺。 更穩(wěn)妥的方式是“輔助駕駛”。讓機器學(xué)習(xí)輸出建議(Feature),讓人來做最終判斷(Decision)。人的反饋(Feedback)再回流給系統(tǒng),用來修正數(shù)據(jù)和優(yōu)化模型。 這不僅降低了風(fēng)險,更是讓業(yè)務(wù)人員參與到“訓(xùn)練機器”的過程中,減少抵觸情緒。

3.建立“誰污染,誰治理”的權(quán)責(zé)機制

這是源動力能否持續(xù)的關(guān)鍵。 技術(shù)部門是煉油廠,但原油是業(yè)務(wù)部門開采的。如果業(yè)務(wù)部門只管挖不管埋,源頭污染永遠無法解決。 必須在管理機制上明確:銷售錄入的數(shù)據(jù)如果不準(zhǔn),導(dǎo)致模型跑出來的線索質(zhì)量差,后果由銷售部門承擔(dān)。只有利益掛鉤,治理才能落地。

五、回歸常識的遠見

在這場AI化的浪潮中,我們不需要更多的焦慮,只需要更多的常識。業(yè)務(wù)智能不是魔法,它是一場工程,遵循著能量守恒的定律:在數(shù)據(jù)治理(源)上省下的力氣,一定會在模型應(yīng)用(力)的失敗中加倍償還。

對于今天的管理者而言,審視企業(yè)的AI戰(zhàn)略,不應(yīng)只看買了多少張顯卡,建了多少個模型。而應(yīng)低下頭,去看看地基里的管網(wǎng)是否通暢,去看看流淌在系統(tǒng)里的數(shù)據(jù)是否純凈。

數(shù)據(jù)治理是“靜”,機器學(xué)習(xí)是“動”。數(shù)據(jù)治理是“信”,機器學(xué)習(xí)是“智”。只有當(dāng)靜與動結(jié)合,信與智互通,業(yè)務(wù)智能的源動力才會不斷地涌現(xiàn)。這不性感,但很真實。而在商業(yè)世界里,只有真實的東西,才具有長久的生命力。

本文由 @沈素明 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!