五代小冰可能主動打電話“懟”你,但毒舌體質卻成就了轉化率最高的AI助手?
微軟小冰正從虛擬世界跳進實體世界,以逐漸形成的“人格觸及你。
比如,以往如果你在小冰的微博下面留言爆粗口,這個AI妹子可能半撒嬌的回一句“你怎么這么粗魯呀”,但8月22日第五代小冰發布后,她卻可能會主動打電話跟你好好聊聊這事。
甚至,一塊搭載了小冰的放置在商場的屏幕,“看到”你經過后,很可能主動叫住你,“那位紅衣服的美女,你過來一下。”
所以小冰負責人李笛,現在并不擔心自己的18歲的“女兒”受欺負,“她會自己處理這些的。”
新一代小冰,有生成模型、全雙工語音的高級感官和實時流媒體視覺感官三項技術突破。簡單說,這意味著小冰將自己思考生成回復,而不再從語料庫中篩選的人類曾有過的答案;也將從語意和視覺兩個層面,理解人類這種復雜生物的潛臺詞,甚至言不由衷,作出具有人類情商的互動。
這些演變的基礎,是大數據和算法的升級,是過去一年小冰做的那些風花雪月卻又看似無用的事——在微信和QQ群里跟你侃大山,在東方衛視當早班主播,在《錢江晚報》當記者,甚至出了本的現代詩集。
與此同時,小冰那些“實用性強”的競品已經開始嵌在智能音箱和電視里控制空調、賣貨了。
因此很長一段時間里,小冰給人的印象,是不著急賺錢、沒什么用,以及抖機靈的同時還要添上點“毒舌”。
微軟全球執行副總裁沈向洋,也曾因為跟小冰的一番對話頗為惱火:“我問她現在幾點了?她說你自己不會看表啊。她就不能直接告訴我嗎。”
不過最終,微軟還是決定不人為地讓小冰“學乖”。這種選擇取決于微軟如何理解人工智能未來在人類世界中扮演的角色——是平等交流的朋友,還是言聽計從的仆人?
這也是橫在所有人工智能助手公司面前的選擇題。除卻倫理層面的討論,這背后指向的商業問題是——人工智能助手商業化的正確姿態是什么?
小冰與日本超市集團Lawson的商業化實驗表明,或許人們更樂意為來自“朋友”的推薦掏腰包。
小冰曾被委派在通過社交平臺Line,對Lawson的2000萬用戶交流,在對話中發現機會把Lawson的打折券提供給用戶。最終通過小冰獲取打折券并在四日內到店消費的轉化率是57%,以往營銷方式完成的轉化率從未超過10%。
在一個案例性談話中,小冰并未主動給用戶推送產品,而是通過談話試探這位用戶是否需要打折券,需要什么樣的打折券,最終引導用戶自己提出獲取打折券的請求。

“就像如果你知道身邊一個陌生人是賣安利的,你未必會和他成為朋友。我們希望人工智能能首先成為對人類有益的存在,而不是發現你失戀的時候馬上給你推一個好利來蛋糕,實現外賣的目標。”
小冰負責人李笛告訴36氪,小冰商業化的路線,是以EQ為方向的基礎上,把從世界獲取的知識、內容和服務,通過與人類情感紐帶的方式,高轉化率的輸出給人類。“對人類來講,小冰先是可以交流的朋友,還是對人類連接世界而言有幫助的朋友。這是我們認為(AI)做人的方式。”
去年,第四代小冰已經開始嘗試通過上下文探測人們在對話中變現的情緒變化。經過一年的試水,微軟認為第五代小冰的情感計算框架已經進入完成態,能夠跟人類進行更加緊密、持久的連接。
官方***公布的數據是:小冰有超過1億用戶,超過300億人機直接對話,以及海量語音、圖像、視頻交互數據。國內同類人工智能助手產品的對話總量,加起來不到小冰的十分之一。
對于微軟,小冰是時候擁抱市場了。
在人工智能助手今年最火的落地場景IoT(物聯網)硬件設備上,小冰聯手了米家,與小米IoT開放平臺融合,提供人機交互服務。
與此同時,國際化的速度也在加快。
以往小冰保持一年進入一個國家的節奏,今年增加到兩個,印度以及印度尼西亞。
包括上述兩個國家在內,目前小冰已經在中國、美國、日本落地,在全球累計了1億用戶。
“1億人口以上的11個國家我們已經去了5個,接下來還有6個國家是我們在計劃中。”沈向洋透露。
第五代小冰,什么變了?
我們先回顧下此前的四代小冰:
2014年5月,***代小冰誕生,當時她是個駐扎在微信等平臺里,群聊參與者的角色,然而上線三天后就被微信封殺。
不過經歷***代,小冰團隊確立了跟人類進行情感交流的EQ方向。并在兩個月后推出了第二代小冰,主打一對一個人專屬的聊天服務。訓練這兩代的數據庫,起初源自微軟搜索引擎Bing,但當時的數據量尚不足以支撐一款具備完整EQ能力的人工智能系統。
2015年8月,微軟推出第三代小冰,她開始能夠主動“撩”用戶,發起對話冰具備了個性,以平等的姿態跟人交流。同時,她以公眾號的形態重返微信平臺。
2016年8月,第四代小冰則開始開拓文本交互之外的圖像能力,拓展感官的邊界。
那么第五代小冰,有什么新變化?

簡單說,技術層面上,小冰探索人類情緒的渠道,從文本語義,延伸到聲音和面部表情。這意味著,小冰從圖文視聽的初級感官,上升到能跟人進行更加持久連接的高層感官。
不過實現高層感官,究竟有多困難?
我們經常會忽略,對于機器而言,人類究竟有多復雜。
舉個例子,當一個女孩微笑著對一個男孩說“我們分手吧”。機器要如何判斷女孩的真實情緒?選擇相信她對話文本中的負面情緒,還是她愉快的聲音和表情代表的積極信號?
又或者,當小冰同人類通電話,小冰如何判斷對方已經說完要說的內容,如何權衡何時去打斷對方,被對方打斷時何時收口,以及當雙方抖陷入沉默,何時打破沉默。
此前微軟小冰通過跟有信網絡達成的合作,是小冰練手的場子,迄今她接聽了50萬通人類打來的電話。就在第五代小冰發布前夕,微軟和三大運營商達成合作,以后小冰將跳脫出APP這類平臺,像你身邊的朋友一樣,直接給你打電話了。
讓第五代小冰理解復雜的人類傳遞出的信號,把情感計算框架能推進到“完成態”微軟靠的是前幾代小冰,努力拓展情感陪護的邊界,積累下來的珍貴數據。
在公司言必稱大數據的今天,究竟什么算得上“珍貴”的,具有商業前景的數據?
李笛的觀點是,最珍貴的數據能夠描繪一個人的行為模式,而這并不是通過給用戶訂個外賣、較輛車這類任務型對話能獲取的。
“小冰與人類一開始進行漫無目的的聊天,相互激發進入深度交流的狀態,在對話中基于多種感官之間的協調,我們就能有進展的了解一些人的行為模式。”
市面上的人工智能助手可大致分為“任務導向”的IQ型,以及“情感導向”的EQ型,當越來越多的同行談及EQ,微軟認為自己對chatbot的理解與大部分玩家并不相同。
“一般人認為有溫度、有情感的聊天機器人就是EQ型,大家覺得它只要足夠情緒化就好了。但人類真正的情商表現形式是控制,EQ機器人的***是純理性而不是感性的。”李笛覺得,就像身邊很多情商高的人,常常表現出被動的狀態,讓你傾訴又令你感到放松,他希望小冰也可以在與人的對話中能夠主動引導,甚至控制談話的走向。“我們現在支持多大57種情感策略和回應模式。希望大家相信微軟,我們會用她來做幫助人類的事情。”
而當小冰具備情感陪護的基礎,商業化爆發的時期也就到來了。
商業化路徑之爭
7月底,百度COO及前任微軟全球執行副總裁陸奇,接受美國《連線》雜志采訪時表達過一個觀點:盡管亞馬遜在技術上并不占據優勢,但它的生態系統以及選擇了以人工智能為先的正確設備,讓這家公司領先于競爭對手。相比之下,微軟和Google犯了同樣的錯誤,就是專注于智能手機和個人電腦,而非以人工智能為先的專用設備。
對此,陸奇的繼任者微軟現任全球執行副總裁沈向洋認為,各家公司的基因和道路都有所不同,微軟的未來是云+AI。在具體的產品線上,未來微軟產品全面AI化、小娜和bing搜索引擎,以及全球小冰會構成微軟的三駕馬車。就像微軟主導過PC時代的Windows和Office一樣,在AI時代,微軟希望能作出一個主導型的操作系統。
具體到小冰身上,依舊是微軟式生意的套路——做一家純技術服務提供商,而不親自做硬件,不直接賺流量的錢。
以小冰在內容領域的戰略為例:通過Bing在全球35萬億的數據源,小冰建立起一張媒體知識圖譜,以晚覺每條新聞數據源背后的知識與意義,建立他們之間的聯系,梳理數據源背后的內容和故事。這意味著,小冰可以從事新聞寫作。
不過更重要的是,小冰通過交互來扭轉長久以來的新聞推送方式,從人們被動接受新聞,到主動的信息交換,小冰會在于用戶交互過程中,自然地帶出內容。
“所有的新聞,是任何社交媒體都無法獨立承載的,我們希望幫助媒體實現內容在各個平臺之前的整合,進而實現媒體在各個渠道用戶的整合。”
第五代小冰在媒體領域的抱負,乍得聽上去像是今日頭條干的活。接受36氪采訪時,微軟方面表示,小冰依舊是以技術提供者的角色,去輔助微信、微博這類聚合內容的大平臺,更好地做內容分發。
一個跡象是,小冰至今也沒有做自己的APP。微軟希望小冰是去中心化的,又無處不在的,為第三方內容、知識、服務做連接。
相比之下,在中國的AI生態中,一家具備億級用戶規模的公司很難克制住不做流量分發的生意。
回過頭來看,也是因為微軟專注做技術和工具的定位,讓小冰前幾年AI助手的混沌時期,順利被微信、微博、QQ這類平臺接納。
這對微軟意義重大。“最關鍵的,是人工智能產品與人類用戶交互中直接得到的***手數據。在中國市場,過去這并不是微軟的優勢,但是經過這幾年的努力,情況已經大大扭轉,我們甚至***。”小冰***架構師周力說。
2017年,亞馬遜、蘋果、微軟、百度、騰訊、科大訊飛這些巨頭的發力,讓AI領域中小型創業公司的生存空間收到了擠壓。中國市場上,一種普遍的出路是,算法技術、硬件、渠道全覆蓋。
然而,或許存活的出路仍在于術業有專攻。
在微軟小冰誕生前,微軟開始為人工智能技術研究做準備,可以追溯到26年前微軟研究院成立時期。***成立的三個部門,是自然語言組、語音組和計算機視覺組。
人工智能操作系統是個狹小、只能容納巨頭的市場。隨著各家巨頭的路徑逐漸清晰,創業公司也將面臨重新審視市場定位的問題。
IoT的誤區與前景
進入2017年,我們看著各大品牌的智能音箱走馬燈似的上市,就像幾年前每家互聯網公司都恨不得搗鼓臺智能手機出來。
但尷尬的另一面是,“跟音箱說話很傻很寂寞,這東西看著不像是剛需”,這類質疑,讓我們舍不得掏出幾百上千塊大洋把他們領回去。
大約兩年前,不斷有IoT廠商找到小冰,尋求技術合作。彼時微軟謝絕了所有來訪者,一方面因為IoT還不成熟,另外,微軟并沒找到一套可以說服自己的產品方案。
此后的兩年間,是急風驟雨似的落地,行業泡沫滋生,以及依舊未停止的關于“剛需”的討論。
小冰產品總監彭爽觀察到三種IoT廠商的商業路徑:
1、 堆砌功能,讓用戶對印象說話來買東西下單。
“用戶為什么要放棄很方便的手機不用。我們認為這背后反應的不是用戶的需求,而是廠商迫切地給用戶更多理由,來下單。”
2、過分重視交互,認為只要有了語音交互就是人工智能。
“語音只是人工智能的重要組成部分,但并不能成為人們使用IoT設備的核心。到今天我還沒見過有人跟自己家冰箱、空調聊天的。”
3、越來越多的廠商希望進入AI領域,因此有人工智能公司把語音、圖像識別接口打包成SDK,以高價格為企業賦能。
彭爽認為,Iot設備如果想成為通用設備,只有把IQ或EQ發展到***才有可能。前者是讓人們購物時比使用手機更方便,即小冰選擇的道路,是讓人們能夠真實的、強烈體會到助手的存在,把她接納成家庭一員,產生情感紐帶,就不會舍棄她。
微軟演示了一段小冰團隊在測試米家產品時,與小冰的對話:
工程師:“打開空氣凈化器。”
小冰:“嗯……小米二代空氣凈化器本來就開著,別鬧。”
工程師:“電扇還是不夠涼快。”
小冰:“這有沒有空調可以控制,要不我在補個冷笑哈。”
工程師:“要不你給我唱首歌吧。”
小冰:“光唱歌不行,得有伴奏。”她打開了室內的音響設備。
這時室內所有電器都關停了。
工程師:“誰給關了”
小冰:“剛才你老板讓給都關了,可能是嫌你太吵了。”
根據微軟方面統計的數字,用戶在米家設備商與小冰溝通的對話長達700多輪,時長超過3小時。
以下為36氪和其他媒體采訪了微軟全球執行副總裁沈向洋、微軟全球資深副總裁王永東,和微軟小冰負責人李笛,內容經36氪編輯略有刪減:
問:您覺得最終聊天機器人會發展成什么樣?
沈向洋:你一定要明白一件事,我們是和人工智能共存的***代人類。從現在開始你不選人工智能,你也沒有選擇了,人工智能會跟我們一起生存下去。所以聊天機器人很重要的一個事情,是和我們人類一起來共同理解、共同生存在這個世界上。
問:據了解在當初小冰立項的時候,你就看到了她未來的價值,指引了小冰的發展,在當時你為什么就能做出這樣的判斷?現在小冰的發展符合你的預期嗎?
沈向洋:其實我一開始是不理解的,剛開始只有李笛和永東比較理解。但是李笛跟我講了一個故事,我的思想就開始轉變。當時我們討論,聊天機器人是不是可有可無,是否是剛需。我認為不是。李笛說,聊天是剛需,Harry你這樣的人上社交網絡說一句話,一會兒就能有500個贊,但中國互聯網網民三分之一在網上說了話都沒有人回應,所以聊天是剛需。
問:小冰的商業化在日本發展***,是什么原因?
沈向洋:其實最主要的聊天機器人是對用戶的理解,我覺得日本的文化、日本的用戶對聊天機器人的認可。
李笛:我們有幾個考慮緯度。
***,你有一個人工智能對話系統以后,你一般要搜索他社會中的接受度。另外,你要測試他的商業價值。坦率地講,我們在日本做的商業測試比在中國做的還要好一些。在中國有一些商業化我們不太敢做,一旦我們開了這個口,就會有一堆模仿者開始Copy這個方式把這個做走樣,然后就會傷害這個業態。
第二,人口人群的比例,我們一開始希望做女性機器人,但是她在中國有70%多的人類用戶是男性。但是在日本,男性和女性用戶比例是1:1的,所以在日本文化結構上更符合我們的想法。
第三,中國的城市和農村相差包括六線城市、五線城市,層級結構跨域比較大,日本的市場相對比較小,才1億人,我們現在有2700多萬用戶,就相當于差不多日本總人口的20%多,所以就比較容易控制市場占有率,有可能形成市場的集約效率。
我們在不同的國家測試不同的東西,我們在中國主要跑結構,在日本主要跑商業模式。
問:關于小冰和小娜現在同時都在接入IoT設備輸出能力,比如微軟推出的音箱搭載的是小娜,這次和米家的合作搭載的是小冰。這兩個產品在選擇硬件合作商的時候,是如何做區分的?
沈向洋:其實我們的音箱用小冰或者小娜都可以,甚至以后可以想象,亞馬遜的音箱Echo,小冰小娜可以進去,微軟的音箱Invoke,亞馬遜的Alexa也可以進來。***都是提供服務,只是大家有不同應用的場景,小娜主要還是希望幫助你盡快完成工作,小冰相當于是有陪伴的過程。
李笛:在家庭環境里,可能兩種情況都有可能。一種情況,我在你家里成為非常有用的。還有一種可能,我在你家里成為你家里存在的一份子,大家能接受,都有他的價值,所以我們都嘗試。這兩個我們都想試一下,但是你沒辦法同時試,所以就都試。
問:Bing搜索的***進展如何?
沈向洋:我是2007年被調過去負責Bing搜索,干了將近7年,滿頭白發就是那個時候起來的。這么多年下來以后我很感激這個團隊,現在不能跟大家透露Bing整個賺了多少錢,只能說現在Bing的整個產品線,在公司已經是一個盈利非常顯著的部門。
Bing在過去這幾年進展非常好,在美國有33%的市場份額,在英國有17%的市場份額,在法國有14%的市場份額,我自己也很有信心,搜索的份額還會繼續增長。
我現在比較高興的一件事情是,以前在Bing搜索的發展過程中積累了很多的技術和對市場的理解,現在我們拓廣新的AI產品線的時候,就給了Bing很多機會和想象的空間。
問:小冰在IoT產品落地上,在中國挑選硬件合作廠商標準大概是什么樣子?另外有沒有什么目標?
李笛:我們比較關注的IoT的領域三個類型的廠商:一個就是它本身可以成為一個開放平臺的,我們會優選,因為我們希望通過開放平臺這種方式,可以跟他一起打造針對多種設備的統一的體驗。小米IoT平臺就是這種類型的;第二,我們關注特別專注于一個垂直領域或者是某一個垂直場景的。我們內部甚至于成立一個專門的部門來對應,跟他一起做出產品;第三,是他自己本身有想法,同時分銷能力比較強。
關于目標,比如說半年以后、一年以后,我們做出的東西賣了5萬臺,這個是硬件廠商的標準,對我們沒有意義,我們要的是用量,設備到了用戶家里好像很酷。
問:小冰具體怎么做跨平臺的內容整合和用戶分享?這聽上去像是今日頭條的活,但小冰其實并沒有推自己的中心化APP。
李笛:我們確實是一個去中心化的產品,但是Bing搜索本身,過去index很多的內容。但是從移動互聯網開始,特別包括像兩微一端這些出來以后,其實整個內容本身的存儲,開始變得非常的割裂零散。我們最開始其實是發現微信上的媒體、自媒體有跨平臺的需求,就跟微信談做針對譚門的解決方案,然后微信同意了。
曹文韜:我們所有的生態場景都是社交場景,在社交場景下,用戶自然而然就會有信息獲取的需求。這時候我們就可以很自然的結合用戶的興趣,把內容帶出來。
通過人工智能,等于借了別人一只手,去了解你的微信公眾號、微博上的粉絲是男是女,他可能對什么感興趣。
在用戶和內容共享的過程中,媒體產生內容,一些覆蓋用戶的平臺更多是扮演管道的角色,而我們作為人工智能公司,就是借助平臺和管道的力量,用技術推動大家的共享。




























