機(jī)器學(xué)習(xí)需要注意的13個(gè)陷阱!
譯文【51CTO.com快譯】想在如今快速發(fā)展的商業(yè)經(jīng)濟(jì)形勢(shì)下取得成功,就需要企業(yè)迅速、大規(guī)模地利用數(shù)據(jù)。由于數(shù)據(jù)的數(shù)量、速度和種類不斷增加,使用機(jī)器學(xué)習(xí)和人工智能來篩查所有流入的信息,解讀數(shù)據(jù)并且準(zhǔn)確地預(yù)測企業(yè)的未來方向變得必不可少。
然而,搞好機(jī)器學(xué)習(xí)并非易事。它需要合適的專長、合適的工具以及合適的數(shù)據(jù),才能兌現(xiàn)機(jī)器學(xué)習(xí)的承諾。即便所有這些因素都考慮到位了,還是很容易出差錯(cuò)。
數(shù)學(xué)家兼決策網(wǎng)站ClearerThinking.org的創(chuàng)始人斯賓塞·格林伯格(Spencer Greenberg)認(rèn)為:“機(jī)器學(xué)習(xí)為我們提供了一系列非常有效的用于預(yù)測的方法,但是如果你不明白自己的機(jī)器學(xué)習(xí)算法在做什么,它也會(huì)帶來災(zāi)難性后果。一旦算法經(jīng)受訓(xùn)練,就要研究算法,弄清楚算法在如何預(yù)測,它所做的從企業(yè)的角度來看是否有意義,這很重要。”
機(jī)器學(xué)習(xí)有時(shí)被視為是解決所有企業(yè)挑戰(zhàn)的萬靈藥。如果沒有考慮到實(shí)際的潛力和嚴(yán)重的局限性,誰都很容易誤解和誤用機(jī)器學(xué)習(xí)。
全球產(chǎn)品開發(fā)和技術(shù)咨詢公司Cambridge Consultants的機(jī)器學(xué)習(xí)主管蒙蒂·巴洛(Monty Barlow)在接受采訪時(shí)說表示:“由于一連串的媒體報(bào)道,各大公司在機(jī)器學(xué)習(xí)方面取得重大進(jìn)展――棋類游戲擊敗人類對(duì)手,醫(yī)療篩查方面取得突破等等。這讓人覺得這個(gè)領(lǐng)域在不斷迅速取得進(jìn)展,淡化了遇到的挫折和困境。實(shí)際上,可能很晚才收到機(jī)器學(xué)習(xí)方面的投資回報(bào),或者根本收不到。”
許多企業(yè)組織在以戰(zhàn)術(shù)性和戰(zhàn)略性方式使用機(jī)器學(xué)習(xí),比如進(jìn)行產(chǎn)品推薦或?yàn)閼?zhàn)略決策提供依據(jù)。雖然進(jìn)行離譜的產(chǎn)品推薦帶來的風(fēng)險(xiǎn)比較低,但是推薦一旦離譜會(huì)讓客戶流失。
由于運(yùn)用不當(dāng)?shù)臋C(jī)器學(xué)習(xí)而做出缺乏事實(shí)依據(jù)的戰(zhàn)略決策會(huì)給企業(yè)釀成嚴(yán)重后果。
普華永道(PwC)竭力從美元和股東價(jià)值方面來量化數(shù)據(jù)驅(qū)動(dòng)的重大戰(zhàn)略決策在經(jīng)濟(jì)方面的影響。它還試圖了解不同的行業(yè)領(lǐng)域依賴機(jī)器智能的程度。該公司全球和美國數(shù)據(jù)及分析負(fù)責(zé)人丹·迪菲利波(Dan DiFilippo)在接受采訪時(shí)說:“2014年,我們讓大家量化他們所做的決策,在經(jīng)濟(jì)方面的影響多達(dá)數(shù)億美元。這次,我們要求他們從股東價(jià)值方面來衡量,大多數(shù)人選擇對(duì)股東價(jià)值的影響在5%至50%。即便說少一點(diǎn),一家大企業(yè)5%的股東價(jià)值也會(huì)是個(gè)大數(shù)目。”
總之,不管你在運(yùn)用機(jī)器學(xué)習(xí)這條道路上處于哪個(gè)階段,都有必要知道誤用機(jī)器學(xué)習(xí)和人工智能可能會(huì)導(dǎo)致企業(yè)誤入歧途的陷阱。
1、不準(zhǔn)確的預(yù)測。
機(jī)器學(xué)習(xí)常常用于做預(yù)測。例子包括改善搜索結(jié)果,預(yù)料電影和產(chǎn)品選擇,預(yù)料客戶購買行為,或者預(yù)測新的攻擊手法類型。
預(yù)測不準(zhǔn)確的一個(gè)原因與“過擬合”有關(guān):如果機(jī)器學(xué)習(xí)算法本身太過適應(yīng)數(shù)據(jù)中的干擾,而不是發(fā)現(xiàn)底層的信號(hào),就會(huì)出現(xiàn)這種情況。
ClearerThinking.org的斯賓塞·格林伯格認(rèn)為:“如果你試圖讓一種極其復(fù)雜的模型擬合一小批數(shù)據(jù),你總是可以迫使算法擬合,但它不會(huì)很好地推廣到將來的數(shù)據(jù)。實(shí)際上,你的復(fù)雜模型會(huì)拼命試圖準(zhǔn)確地?fù)糁忻總€(gè)數(shù)據(jù)點(diǎn),包括應(yīng)該忽視的隨機(jī)性波動(dòng),而不是為數(shù)據(jù)的核心部分建模。必須根據(jù)你擁有的數(shù)據(jù)量以及數(shù)據(jù)的干擾性有多大來選擇你在擬合的模型具有的復(fù)雜性。”
2、你對(duì)不知道的東西一無所知。
市面上缺少機(jī)器學(xué)習(xí)方面的人才。與此同時(shí),機(jī)器學(xué)習(xí)在普及化,相應(yīng)功能逐漸進(jìn)入到更多的應(yīng)用程序和易于使用的平臺(tái),這些平臺(tái)可以掩蓋機(jī)器學(xué)習(xí)的底層復(fù)雜性。“黑盒子”機(jī)器學(xué)習(xí)的缺點(diǎn)在于無法深入了解決策過程。
斯賓塞·格林伯格指出:“并不總是有必要了解模型是如何進(jìn)行預(yù)測的,但就高風(fēng)險(xiǎn)預(yù)測而言,明白算法在做什么變得越來越重要。如果企業(yè)依賴來自機(jī)器學(xué)習(xí)算法的預(yù)測以便進(jìn)行決策,那么問清楚那些預(yù)測是如何做出的很重要。”
明白預(yù)測是如何做出的可能需要數(shù)據(jù)科學(xué)家或能研究算法,向管理層解釋算法行為的工程師的幫助。那樣一來,企業(yè)領(lǐng)導(dǎo)人才能確信預(yù)測正如他們預(yù)期的那樣準(zhǔn)確,結(jié)果就是企業(yè)領(lǐng)導(dǎo)人所想的那種結(jié)果,預(yù)測并不依賴不需要的信息。
3、算法與現(xiàn)實(shí)不一致。
機(jī)器學(xué)習(xí)算法需要加以訓(xùn)練;而想要高效地加以訓(xùn)練,算法需要大量的數(shù)據(jù)。企業(yè)常常針對(duì)某個(gè)特定的數(shù)據(jù)集來訓(xùn)練機(jī)器學(xué)習(xí)算法,然后運(yùn)用算法對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測,范圍未必預(yù)料得到。
斯賓塞·格林伯格說:“如果數(shù)據(jù)的底層特點(diǎn)發(fā)生變化,針對(duì)某個(gè)數(shù)據(jù)集的準(zhǔn)確模型可能面對(duì)另一個(gè)數(shù)據(jù)集時(shí)不再準(zhǔn)確。如果你做預(yù)測的系統(tǒng)變化很慢,這也許沒什么,但如果系統(tǒng)迅速變化,機(jī)器學(xué)習(xí)算法會(huì)做出非常糟糕的預(yù)測,因?yàn)樗谶^去學(xué)到的一套可能不再適用。”
4、固有的偏差。
機(jī)器學(xué)習(xí)算法會(huì)學(xué)會(huì)企業(yè)不想要的偏差。比如,一家想要預(yù)測誰可能會(huì)面臨汽車事故這種風(fēng)險(xiǎn)的汽車保險(xiǎn)公司可能根本不會(huì)提及性別,因?yàn)檫@種差別對(duì)待遭到法律的禁止。盡管性別不包括在數(shù)據(jù)集中,但機(jī)器算法可能會(huì)使用關(guān)聯(lián)來推斷性別,然后使用性別作為預(yù)測因子。
斯賓塞·格林伯格認(rèn)為:“這個(gè)例子表明了兩個(gè)重要原則:首先,從企業(yè)角度來看,做出最準(zhǔn)確的預(yù)測并不總是所需要的,這意味著你可能需要對(duì)算法實(shí)施另外的限制,準(zhǔn)確性不是唯一的限制;其次,算法的智能化程度越高,它就越難控制。消除性別變量未必足以防止算法做出基于性別的預(yù)測,消除你知道與性別有關(guān)聯(lián)的所有變量也是如此,因?yàn)樗惴〞?huì)發(fā)現(xiàn)一種方法來預(yù)測你自己甚至都不知道的性別。”
5、招的人不合適。
招聘網(wǎng)站Monster一直在運(yùn)用機(jī)器學(xué)習(xí)來搞清楚表現(xiàn)最佳的銷售代表是什么樣子,但是結(jié)果還不盡如人意。
Monster的全球人才收購主管馬特·杜塞特(Matt Doucette)認(rèn)為:“我們最初過于關(guān)注定額績效和經(jīng)理評(píng)價(jià)作為衡量優(yōu)秀員工的一個(gè)指標(biāo)。在這些測試的第2個(gè)階段,我們會(huì)深入分析數(shù)字,比如連續(xù)5個(gè)季度的定額平均數(shù)字、折扣評(píng)分、核心與戰(zhàn)略產(chǎn)品百分比、新業(yè)務(wù)與保留,以及績效總體表現(xiàn)等度量指標(biāo)。數(shù)據(jù)集會(huì)變得很龐大,結(jié)果會(huì)更加小眾化,因而可加以精準(zhǔn)化或擴(kuò)展。”
基于機(jī)器學(xué)習(xí)結(jié)果得出不準(zhǔn)確的求職者畫像會(huì)導(dǎo)致企業(yè)招聘的求職者不適合某個(gè)崗位。與此同時(shí),寶貴的時(shí)間浪費(fèi)在了篩選實(shí)際上不合適的求職者身上。杜塞特表示,如果這是創(chuàng)造收入的崗位,招的人不合適給收入帶來的影響會(huì)相當(dāng)大。
6、給收入帶來的危害。
一些機(jī)器學(xué)習(xí)系統(tǒng)是在沒有監(jiān)管的情況下運(yùn)行的,另一些則需要密切監(jiān)管。無論怎樣,不監(jiān)管機(jī)器學(xué)習(xí)算法及它們對(duì)企業(yè)帶來的影響是個(gè)錯(cuò)誤。
預(yù)測分析和數(shù)據(jù)科學(xué)公司Lumidatum的創(chuàng)始人兼首席執(zhí)行官帕特里克·賴斯(Patrick Rice)表示:“算法和機(jī)器學(xué)習(xí)技術(shù)的自動(dòng)化方面取得了非常驚人的進(jìn)展,以至于很容易抱有‘建好后不管’的心態(tài)。然而,這可能會(huì)給客戶和企業(yè)帶來非常嚴(yán)重的后果。”
“公司需要更加系統(tǒng)性地監(jiān)管部署在生產(chǎn)環(huán)境的機(jī)器學(xué)習(xí)系統(tǒng)。不管在什么時(shí)候,每個(gè)人(不僅僅是工程師和數(shù)據(jù)科學(xué)家)都應(yīng)該深入了解它在如何運(yùn)行,它在如何響應(yīng)新的客戶查詢,它在如何逐漸變化。當(dāng)然萬一發(fā)現(xiàn)任何重大的異常現(xiàn)象,還要能夠關(guān)閉系統(tǒng)。”
微軟的Tay推特聊天機(jī)器人就是訓(xùn)練出岔子的一個(gè)典例。在推特社區(qū)的推波助瀾之下,Tay的種族主義行為變得臭名昭著。微軟在推出16個(gè)小時(shí)后關(guān)閉了它,但是這個(gè)失敗案例仍被媒體大肆宣傳。
7、錯(cuò)誤的假設(shè)。
在完全自動(dòng)化的系統(tǒng)中運(yùn)行的機(jī)器學(xué)習(xí)算法需要能夠處理缺失的數(shù)據(jù)點(diǎn)。最常見的方法就是使用平均值,以此代替缺失值。據(jù)機(jī)器學(xué)習(xí)實(shí)驗(yàn)室主管兼芝加哥伊利諾伊理工學(xué)院計(jì)算機(jī)學(xué)副教授穆斯塔法·比爾吉奇(Mustafa Bilgic)聲稱,這種方法對(duì)數(shù)據(jù)做出強(qiáng)假設(shè),包括數(shù)據(jù)“隨機(jī)缺失”。
比如,比爾吉奇說:“病人缺失膽固醇含量這個(gè)事實(shí)實(shí)際上是非常有用的信息。這可能表明,檢驗(yàn)是有意不進(jìn)行的,這實(shí)際上意味著它可能對(duì)這項(xiàng)任務(wù)來說無關(guān),或者假設(shè)是正常的。有些方法并不假設(shè)特征是‘隨機(jī)缺失’,不過完全自動(dòng)化的方法不可能知道哪些特征是隨機(jī)缺失、哪些不是。”
無論是不是用在完全自動(dòng)化的系統(tǒng),機(jī)器學(xué)習(xí)算法通常假設(shè)數(shù)據(jù)具有代表性、隨機(jī)性,盡管公司的數(shù)據(jù)并不通常是隨機(jī)的。如果數(shù)據(jù)是隱式偏差的,從數(shù)據(jù)得到的洞察力和預(yù)測也會(huì)有偏差。因此,公司應(yīng)該關(guān)注數(shù)據(jù)收集過程中存在的隱式偏差和顯式偏差。
8、不相關(guān)的推薦。
推薦引擎已變得司空見慣。然而,其中一些推薦引擎顯然比另一些來得更準(zhǔn)確。機(jī)器學(xué)習(xí)系統(tǒng)算法進(jìn)一步證實(shí)了它們學(xué)到的東西。比如,如果零售顧客的偏好突然發(fā)生了變化,推薦可能變得完全不相關(guān)。
穆斯塔法·比爾吉奇認(rèn)為:“這就是我們所說的‘利用vs探索’取舍。如果算法試圖利用它學(xué)到的東西,但是沒有給探索留下任何空間,它會(huì)不斷進(jìn)一步證實(shí)已經(jīng)知道的東西,不會(huì)學(xué)習(xí)新的東西,最終變得毫無用處。”
9、欺騙性的簡單性。
機(jī)器學(xué)習(xí)內(nèi)置到各種各樣的應(yīng)用程序中,還有試圖掩藏其復(fù)雜性的諸多平臺(tái)和解決方案。由于需要怎樣才能搞好機(jī)器學(xué)習(xí)或者機(jī)器學(xué)習(xí)會(huì)如何影響企業(yè)對(duì)企業(yè)用戶來說并不總是很明顯,所以很容易過于簡單化。
Cambridge Consultants的蒙蒂·巴洛指出:“一些企業(yè)組織沒有認(rèn)識(shí)到機(jī)器學(xué)習(xí)開發(fā)牽涉廣泛的學(xué)科領(lǐng)域,以及如何管理它們――比如,把機(jī)器學(xué)習(xí)當(dāng)成一種純粹涉及數(shù)學(xué)和算法的項(xiàng)目,或者只是另一種應(yīng)用軟件,或者以為招聘一名數(shù)據(jù)分析員來增強(qiáng)現(xiàn)有的軟件團(tuán)隊(duì)就夠了。團(tuán)隊(duì)?wèi)?yīng)竭力就如何在開發(fā)期間評(píng)估機(jī)器學(xué)習(xí)的表現(xiàn)達(dá)成共識(shí),然后不斷衡量和跟蹤其表現(xiàn)。你需要認(rèn)真規(guī)劃里程碑,并且留意表現(xiàn)突然之間得到‘好得難以置信’的提升。”
10、垃圾進(jìn)垃圾出。
不是所有的數(shù)據(jù)都一樣寶貴或準(zhǔn)確。如果沒有努力解讀數(shù)據(jù),機(jī)器學(xué)習(xí)的結(jié)果可能與預(yù)期要求會(huì)有很大的偏差。
網(wǎng)絡(luò)解決方案廠商瞻博網(wǎng)絡(luò)公司的數(shù)據(jù)科學(xué)家羅曼·西納耶夫(Roman Sinayev)認(rèn)為:“你可能在初始測試中有出色的結(jié)果,后來發(fā)現(xiàn)一旦發(fā)布到生產(chǎn)環(huán)境,你的產(chǎn)品遇到了災(zāi)難性結(jié)果。數(shù)據(jù)科學(xué)家應(yīng)確保他們拿一系列廣泛的意外變量來測試產(chǎn)品,比如狡猾的攻擊者,確保他們考慮到數(shù)據(jù)的每一種可能的結(jié)果。”
11、拼命尋求顛覆。
包括亞馬遜、Facebook、谷歌、網(wǎng)飛和eBay在內(nèi)的公司完全顛覆了所在行業(yè),它們的競爭武器之一就是機(jī)器學(xué)習(xí)。其他公司試圖亦步亦趨,不過評(píng)估機(jī)器學(xué)習(xí)如何給本企業(yè)帶來最大的好處來得很重要。
扎克·克勞斯(Zach Cross)是總部位于亞特蘭大的技術(shù)咨詢公司Revenue Analytics的總裁,他認(rèn)為:“《財(cái)富》500強(qiáng)公司很聰明。它們認(rèn)識(shí)到,運(yùn)用機(jī)器學(xué)習(xí)類型的方法主要是為了確保可擴(kuò)展性、可重復(fù)性和可預(yù)測性,而不是獲得洞察力,將自己帶到不同的方向。如果一家跨國企業(yè)將效率逐步提高2%或3%,企業(yè)就能增收數(shù)千萬美元至數(shù)億美元。”
12、不可預(yù)測的結(jié)果。
無論有沒有采用機(jī)器學(xué)習(xí),復(fù)雜系統(tǒng)的行為本來就難以預(yù)測。由于會(huì)發(fā)生預(yù)料之外的結(jié)果,即便本意再好,投入了大量資金,能做的最好辦法就是盡量減小這些影響。
密歇根大學(xué)信息學(xué)院的W. K. Kellogg副教授肯塔羅·托亞馬(Kentaro Toyama)表示:“要盡量減小負(fù)面影響,最好的辦法之一就是從小處入手,逐步加大系統(tǒng)的范圍、接觸面和影響力。”托亞馬表示,用戶最好創(chuàng)建多個(gè)規(guī)模的沙盒(至少每個(gè)數(shù)量級(jí)創(chuàng)建一個(gè)沙盒),讓新系統(tǒng)或新變化可以在受到密切監(jiān)視的情況下在較小規(guī)模下運(yùn)行一段時(shí)間,然后將規(guī)模擴(kuò)大一級(jí)。
13、盲目的信任。
說到機(jī)器學(xué)習(xí),細(xì)節(jié)至關(guān)重要。如果用戶盲目信任和實(shí)施來自機(jī)器學(xué)習(xí)的洞察力,并不了解洞察力背后的原因,可能會(huì)將其雇主、客戶或者甚至整個(gè)公眾暴露在風(fēng)險(xiǎn)面前。
機(jī)器智能應(yīng)用軟件廠商N(yùn)utonian的創(chuàng)始人兼首席技術(shù)官邁克爾·施密特(Michael Schmidt)說:“我們還沒有準(zhǔn)備好根據(jù)獨(dú)立于任何人類理解能力的模型來做出所有的企業(yè)決策、醫(yī)療決策和重要的生活決策。由于用戶解釋不了模型,這可能會(huì)導(dǎo)致金融崩潰,人們因未知原因而被拒絕貸款,或者甚至病人在治療疾病時(shí)被誤診。”
簡言之,如果你無法解釋為何你的機(jī)器學(xué)習(xí)模型做出了決策,就不該將它用于重要事情。
原文標(biāo)題:13 Ways Machine Learning Can Steer You Wrong,作者:Lisa Morgan
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】





















