AWS公布一項全新機器學習服務,并面向開發者提供全球首款深度學習攝像機
原創【51CTO.com原創稿件】在今天召開的AWS Re:Invent大會上,Amazon Web Services(簡稱AWS)公司公布了五項***機器學習服務以及一款面向開發者的深度學習型無線視頻攝像機。Amazon SageMaker是一項全托管服務,可供開發者與數據科學家用于快速構建、訓練、部署并管理自己的機器學習模型。AWS方面還推出了AWS DeepLens,一款深度學習型無線視頻攝像機,其可運行實時計算機視頻模型,從而為開發者提供與機器學習相關的實踐體驗。此外,AWS亦公布了四項新服務,允許開發者構建相關應用程序以模擬人類認知能力:Amazon Transcribe用于語音到文本轉錄; Amazon Translate用于不同語種間的文本翻譯; Amazon Comprehend用于理解自然語言; 而Amazon Rekognition Video則是一項新的計算機視頻視覺服務,可通過批量及實時方式分析視頻內容。
AWS DeepLens
Amazon SageMaker與AWS DeepLens,讓機器學習飛入“尋常開發者家”
就目前來看,機器學習的實現流程非常復雜,其中涉及大量試驗與錯誤因素,且要求執行人員具備專項技能。開發人員與數據科學家必須首先對數據進行可視化、轉換與預處理,從而將其轉化為可由算法用于進行模型訓練的正確格式。即使是最簡單的模型也需要耗費大量計算資源與時間進行訓練,而企業甚至可能需要雇用專門的團隊來管理由大量GPU支持型服務器所建立的訓練環境。另外,模型訓練的整個過程充斥著大量人為介入與猜測性操作(從選擇與優化算法,到調整將影響到模型準確性的數百萬條參數)。在此之后,我們還需要利用不同的專業技能調整應用程序設計與分布式系統對接,從而將訓練完成的模型引入實際應用程序。隨著數據集與變量的增長,客戶將不得不重復上述流程,因為模型已經過時、需要進行重復訓練,否則將無法立足新的信息實現學習與發展。這一切都需要大量專業知識作為支撐,這必然要求投入大量的計算資源、存儲容量以及時間。就目前來講,機器學習對于大多數開發人員仍可謂遙不可及。
Amazon SageMaker是一項全托管機器學習服務,能夠有效消除機器學習流程中各階段所涉及的繁重轉換與猜測工作。Amazon SageMaker提供預構建開發記事本、針對PB級數據集進行優化的多種流行機器學習算法,外加自動化模型調優機制,能夠有效降低模型構建與訓練的難度。Amazon SageMaker還能夠顯著簡化并加速訓練過程,自動完成基礎設施的配置與管理工作,并借此訓練模型以及運行推理進而完成預測。AWS DeepLens則從零開始設計,旨在幫助開發人員通過將該物理設備同廣泛的教程、示例源代碼以及原本熟知的AW服務進行匹配,最終獲得構建、訓練及部署模型的實踐經驗。
AWS公司機器學習副總裁Swami Sivasubramanian解釋稱,“我們最初設定的AWS發展愿景,是希望任何一位用戶都能夠像世界上規模***的企業那樣獲得同樣的技術、工具、規模與成本結構。我們希望所有開發人員都朐晚為廣泛且成功地使用機器學習工具,而不必受限于其機器學習技術水平。Amazon SageMaker消除了機器學習流程當中的諸多難題與復雜性因素,使得開發人員能夠輕松上手模型的構建、訓練與部署工作。”
利用Amazon SageMaker,開發人員可以:
· 利用性能優化型算法輕松構建機器學習模型:Amazon SageMaker是一套全托管機器學習記事本環境,允許開發人員輕松對其存儲在Amazon S3當中的數據進行探索與可視化處理,并利用各類流行庫、框架及接口對數據進行轉換。Amazon SageMaker中包含數十種***的深度學習算法(例如k平均值聚類、因式分解、線性回歸與主成分分析),其中AWS優化后的運行速度比標準實現方案快十倍。開發人員只需要選擇算法并指定其數據源,而后Amazon SageMaker將安裝并配置底層驅動程序與框架。Amazon SageMaker還包含有原生TensorFlow與Apache MXNet集成,更多其它構架支持能力也將陸續引入。開人員亦可通過將框架及算法上傳至Amazon EC2容器注冊表中容器的方式指定希望使用的框架與算法。
· 快速、全托管訓練:Amazon SageMaker使得訓練更為簡單。開發者只需要簡單指定Amazon EC2實例的類型與數量,同時指定其數據位置即可。Amazon SageMaker將設置分布式計算集群、執行訓練、將結果輸出至Amazon S3,并在完成后關閉此集群。Amazon SageMaker能夠自動利用超參數優化機制對模型進行調優,同時調數以千計的不同算法參數組合,從而實現更高的預測準確率。
· 一鍵式生產環境模型部署:Amazon SageMaker可承擔起實例啟動、模型部署以及安全HTTPS端點設置等任務,從而確保具體應用程序獲得高數據吞吐量與低延遲預測,同時在多可用區(簡稱AZ)內實現各Amazon EC2實例的自動規模伸縮。其還提供A/B測試原生支持能力。在生產環境下,Amazon SageMaker能夠消除機器學習基礎設施管理層面的繁重任務、執行健康狀態檢查、應用安全補丁,并完成其它日常維護工作。
利用AWS DeepLens,開發人員能夠:
· 獲得機器學習實踐經驗:AWS DeepLens是業界首款具備深度學習功能且可實現完全編程的攝像機,旨在將深度學習能力交付至每一位開發人員手中。AWS DeepLens包含一臺帶有板載計算機的高清攝像機,其能夠實時運行復雜的深度學習計算機視覺模型。其定制設計硬件每秒可運行超過1000億次深度學習運算,同時附帶示例項目、示例代碼以及預訓練模型——意味著毫無經驗的開發人員也能夠在十分鐘之內輕松上手。開發人員可以對教程進行擴展,利用AWS Lambda函數創建自己的定制化深度學習項目。舉例來說,用戶可以對AWS DeepLens進行編程以識別牌照上的數字并觸發家庭自動化系統開啟車庫門,或者利用其識別寵物狗爬上沙發的行為并及時向主人發送文本警告。
· 在云環境中訓練模型,將成果部署在AWS DeepLens當中:AWS DeepLens可與Amazon SageMaker相結合,意味著開發人員能夠在云端利用后者進行模型訓練,而后僅通過AWS管理控制臺中的數次點擊將其部署在AWS DeepLens之上。該攝像機能夠以實時方式立足自身設備完成模型運行。
NFL CIO兼高級副總裁Michelle McKenna-Doyle解釋稱,“我們深化了與AWS的合作關系,將其作為NFL的官方技術供應商,亦在積極利用Amazon SageMaker作為我們的下一代數據統計方案。通過將Amazon SageMaker引入我們的工具集,我們的開發人員不再需要為機器學習流程中的無意義的重復工作而擔憂,轉而真正構建粉絲們真正樂于接受的可視化、統計數據與體驗。”
作為全球領先的高分辨率地球圖像、數據與分析服務供應商,DigitalGlobe公司每天都需要與無數數據打交道。該公司Maxar技術***技術官兼創始人Walter Scott博士指出,“DigitalGlobe公司致力于幫助人們更輕松地找到、訪問并運行存儲在AWS云中的100 PB圖像庫,從而利用深度學習分析衛星圖像。我們計劃使用Amazon SageMaker,利用托管的Jupyter筆記本工具借助PB級別的地球觀測圖像數據集進行模型訓練。這意味著DigitalGlobe的地理空間大數據平臺(簡稱GBDX)用戶只需要按下一個按鍵,即可創建對應模型,并將其部署到一套可擴展的分布式規模環境當中。”
Hotels.com為全球領先的酒店品牌,以41種語言運營著90個本地化網站。Hotels.com與Expedia Affiliate Network公司副總裁兼***數據科學官Matt Fryer指出,“在Hotels.com,我們一直高度關注如何提升行動速度,從而充分利用***技術成果并保持創新優勢。利用Amazon SageMaker,我們的團隊得以利用分布式訓練、優化算法與內置超參數功能立足規模***的數據集快速構建精度更高的醋,從而縮短將模型投入實際生產所需要的時間周期。只需要一次API調用,Amazon SageMaker即可為我們顯著降低機器學習的復雜性,使我們得以快速為客戶創造更理想的使用體驗。”
Intuit公司也意識到了機器學習的巨大價值與威力,且借此幫助客戶做出更好的日常決策并精簡工作流程。該公司***數據官Ashok Srivastava解釋稱,“利用Amazon SageMaker,我們得以通過在該平臺上構建并部署算法的方式加快自身人工智能項目的規模化進程。我們將創造新的大規模機器學習與人工智能算法,并將其部署在這一平臺之上,最終解決我們客戶所面對的各類復雜問題。”
路透社是全球領先的新聞與信息專業資源供應商。路透社人工智能與認知計算中心負責人Khalid Al-Kofahi指出,“過去25年以來,我們一直在開發先進的機器學習功能,旨在幫助我們的客戶挖掘、連接、增強、組織并傳遞各類信息,確保他們能夠成功簡化工作流程并獲取更多價值。利用Amazon SageMaker,我們得以在問答應用環境下設計出自然語言處理能力。我們的解決方案需要利用Amazon SageMaker的強大功能以多次進行深度學習配置。”
卡耐基梅隆大學計算機科學學院院長Andrew Moore指出,“深度學習是我們的學生們所發現的一大真正鼓舞人心的成果。其似乎每個星期都能夠在機器人、語言以及生物學方面帶來新的突破。而我之所以喜歡AWS DeepLens,也正是因為其似乎有可能令機器學習實驗真正實現民主化。像我們這樣的高校非常樂于將AWS DeepLens引入課堂與實驗室,從而幫助加速學生們立足真實世界了解深度學習的流程。”
新的語音、語言與視覺服務亦允許應用開發者們更輕松地構建智能化應用程序。
對于那些不具備機器學習專業知識,但卻有志于利用這些技術構建人工智能類新型應用程序的開發者,Amazon Transcribe、Amazon Translate、Amazon Comprehend以及 Amazon Rekognition Video能夠提供高質量且高準確度的機器學習服務,同時保持可擴展性與成本效益。AWS機器學習副總裁Swami Sivasubramanian指出,“如今客戶正越來越多地將Amazon S3作為一套可擴展、可靠且安全的數據湖,其中存儲的數據量遠超以往任何時候。這些客戶希望能夠將這些數據應用于企業與客戶,因此他們需要易于使用的工具與技術以解鎖數據中的情報。我們很高興能夠提供這四種新的機器學習應用服務,旨在幫助開發人員立即著手創建新一代智能應用程序,確保其有能力看到、聽到、說出并與周邊世界進行交互。”
· Amazon Transcribe (現處于預覽階段)能夠將語音轉換為文本,允許開發人員將存儲在Amazon S3當中的音頻文件轉換為準確且完整的帶標點文本。Amazon Transcribe已經進行訓練,能夠以高準確度處理低保真度音頻——例如呼叫中心錄音。Amazon Transcribe能夠為各個單詞生成一個時間戳,以便開發人員精確地將文本與源文件進行對齊。目前,Amazon Transcribe僅支持英語與西班牙語,未來還將有更多支持語種被加入進來。在接下來的幾個月中,我們還將努力確保Amazon Transcribe得以同時識別音頻文件中的多個發言人,并允許開發人員上傳自定義詞匯表,以便對包含這些詞匯的音頻進行更為準確的轉錄。
· Amazon Translate (現處于預覽階段)利用目前***進的神經機器翻譯技術,可提供將文本由一種語言轉換為另一種語言的高準確度翻譯能力。Amazon Translate可翻譯不同長度的文本,并支持英語與其它六種語言(阿拉伯語、法語、德語、葡萄牙語、簡體中文以及西班牙語)之間的翻譯。更多翻譯語種長城將于2018年推出。
· Amazon Comprehend (已正式推出)可立足文檔、社交網絡帖子、文章或AWS中存儲的任何其它文本數據進行自然語言內容理解。Amazon Comprehend利用深度學習技術識別文本中的各實體(例如人物、地點、日期與組織)、文本所使用之語言、文本所表達的情感以及包含概念與形容詞——例如美麗、溫暖或陽光明媚等——的關鍵短語。Amazon Comprehend已經經歷了廣泛的數據集訓練,包括來自Amazon.com的產品描述與客戶評論,從而構建起能夠從文本中提取重要結論的***語言模型。其還擁有主題建模功能,可幫助應用程序從文檔集中提取常見主題。Amazon Comprehend與AWS Glue相集成,可對存儲在Amazon S3、Amazon Redshift、Amazon RDS、Amazon DynamoDB或者其它流行Amazon 數據源中的文本數據進行端到端分析。
· Amazon Rekognition Video (現已推出)能夠追蹤大量存儲于Amazon S3中的視頻資料內的對象、面孔、名人與不當內容。其還提供實時流媒體視頻,可對數百萬人臉進行面部識別。Amazon Rekognition Video提供易于使用的API,且由計算機視覺模型進行驅動——這些模型經過訓練,能夠準確檢測出數千個對象及其活動,并從存儲在Amazon S3中的實況視頻流及視頻內容中提取基于情景信息的活動。Amazon Rekognition Video能夠自動為視頻的特定部分(例如海難、太陽、孩子)添加標簽與位置、檢測活動(例如跑步、跳躍與游泳),檢測、識別并分析人臉,并追蹤多個人物對象——即使其有可能被部分隱藏在畫面當中。
Isentia公司CIO Andrea Walsh表示,“在Isentia,我們使用一種語言構建自己的媒體智能軟件。為了擴大業務能力,滿足客戶多樣化的語言需求,我們需要翻譯支持以生成非英語媒體內容,同時提供有價值的見解。Amazon Translate服務給我們留下了深刻的印象,因為其能夠被輕松整合至我們的管道當中,其強大的擴展能力確保我們能夠處理任何數量的工作,且翻譯結果更準確也更細致,足以滿足客戶提出的嚴格要求。”
RingDNA公司CEO兼創始人Howard Brown指出,“RingDNA是一套面向銷售團隊的端到端溝通平臺。數百家企業利用RIngDNA大幅提升自身生產力,進行更為明智的銷售對話,獲取預測性銷售洞察力,提高訂單成功率并訓練銷售代表。RingDNA的Conversation AI中一大重要組成部分,在于能夠以***方式實現每通電話的語音到文本內容轉錄。RingDNA對Amazon Transcribe的出現感到興奮,因為其能夠提供規模化高質量語音識別能力,幫助我們更好地完成每一項語音轉錄任務。”
《華盛頓郵報》數據科學主管Sam Han博士表示:“我們努力為近1億讀者提供最出色的體驗,而內容的相關性是實現這一目標的關鍵性前提。在Amazon Comprehend的幫助下,我們得以利用持續訓練的自然語言處理功能(例如關鍵詞加主題API)提升內容的個性化程度、搜索引擎優化效果以及廣告定位功能。”
Infor公司軟件開發副總裁Manjunath Ganimasty指出,“構建智能應用程序以幫助客戶促進業務發展是我們的核心目標所在。Amazon Comprehend允許我們在搜索、聊天與文檔當中分析非結構化文本,從而理解其意圖與情感。這樣的能力使我們得以訓練出自己的Coleman AI技能集,同時為客戶提供真正具有針對性的定制化搜索體驗。”
Elementum公司工程技術負責人Minh Chau指出,“自然語言處理非常困難。我們曾經對從閉源到開源的各類解決方案進行研究,希望利用其分析并理解我們的數據,但卻一直沒有找到任何一種能夠使我們保持敏捷性、可擴展性以及成本效益的解決方案。Amazon Comprehend提供一種持續訓練模式,使我們能夠專注于自身業務,并在供應鏈管理(簡稱SCM)領域切實進行創新。”
奧蘭多市警察局局長John Mina表示:“奧蘭多市很高興能夠與Amazon合作,通過***的公私合作伙伴關系試用***的公共安全軟件。通過試點,奧蘭多市將利用Amazon的Rekognition Video與Acuity技術,配合現有城市資源對人群對象進行實時檢測,并在發現可疑人士時發布通知,從而進一步提高奧蘭多乃至全國其它城市的公共安全保障能力與運營效率。”
摩托羅拉公司***數據科學家Dan Law解釋稱,“Amazon Rekognition Video的分析能力令人印象深刻。舉例來說,其可幫助我們搜索歷史與實時視頻,用以提高效率與意識,而這從傳統角度看一直屬于必需依靠人工方式才能完成的任務。”
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】






















