精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用AWS云端機器學習,構建無服務器新聞數據管道

譯文
人工智能 機器學習
本文介紹了如何使用作為Sagemaker端點來部署的機器學習模型在AWS上構建無服務器數據管道。

[[436699]]

【51CTO.com快譯】作為一名分析師,我花很多時間來跟蹤新聞和行業最新資訊。我在休產假時考慮了這個問題,決定構建一個簡單的應用程序來跟蹤有關綠色技術和可再生能源的新聞。使用AWS Lambda及AWS的其他服務(比如EventBridge、SNS、DynamoDB和Sagemaker),可以非常輕松地上手,在幾天內構建好原型。

該應用程序由一系列無服務器Lambda函數和作為SageMaker端點來部署的文本摘要機器學習模型提供支持。AWS EventBridge規則每24小時觸發一次Lambda函數,從DynamoDB數據庫獲取新聞源(feed)。

然后這些新聞源作為SNS主題來發送,以觸發多個Lambda分析新聞源并提取新聞URL。每個網站每天更新RSS新聞源最多只更新幾篇文章,因此我們不會發送大批流量,不然可能會導致消耗任何特定新聞出版物的過多資源。

然而,一大問題是提取文章的全文,因為每個網站不一樣。對我們來說幸運的是,goose3之類的庫通過運用機器學習方法提取頁面正文來解決這個問題。由于版權問題,我無法存儲文章的全文,這就是為什么我運用HuggingFace文本摘要轉換器模型來生成簡短摘要。

下面詳細介紹了如何自行構建基于機器學習的新聞聚合管道。

1. 設置擁有必要權限的IAM角色。

雖然這個數據管道很簡單,但它連接許多AWS資源。想授予我們的函數訪問所有所需資源的權限,我們需要設置IAM角色。該角色為函數賦予了使用云端其他資源的權限,比如DynamoDB、Sagemaker、CloudWatch和SNS。出于安全原因,最好不要為我們的IAM角色賦予全面的AWS管理訪問權限,只允許它使用所需的資源。

2. 在RSS Dispatcher Lambda中從DynamoDB獲取RSS新聞源

使用AWS Lambda幾乎可以做任何事情,它是一種非常強大的無服務器計算服務,非常適合短任務。對我而言,主要優點在于很容易訪問AWS生態系統中的其他服務。

我將所有RSS新聞源存儲在DynamoDB表中,使用boto3庫從Lambda訪問它真的很容易。一旦從數據庫獲取所有新聞源后,我將它們作為SNS消息發送,以觸發新聞源解析Lambda。

  1. import boto3 
  2. import json 
  3. def lambda_handler(event, context): 
  4.     # Connect to DynamoDB 
  5.     dynamodb = boto3.resource('dynamodb'
  6.      
  7.     # Get table 
  8.     table = dynamodb.Table('rss_feeds'
  9.      
  10.     # Get all records from the table 
  11.     data = table.scan()['Items'
  12.     rss = [y['rss'for y in data] 
  13.      
  14.     # Connect to SNS 
  15.     client = boto3.client('sns'
  16.      
  17.     # Send messages to the queue 
  18.     for item in rss: 
  19.         client.publish(TopicArn="arn:aws:sns:eu-west-1:802099603194:rss_to-parse",  Message = item) 

3. 使用必要的庫創建層

想在AWS Lambdas中使用一些特定庫,您需要將它們作為層來導入。想準備庫導入,它需要位于python.zip壓縮包中,然后我們可以將其上傳到AWS并在函數中使用。想創建層,只需cd進入到Python文件夾中,運行pip install命令,將其壓縮并準備好上傳。

  1. pip install feedparser -t 

然而,我將goose3庫作為一個層來部署時遇到了一些困難。簡單的調查后發現,LXML等一些庫需要在類似Lambda的環境(Linux)中加以編譯。因此如果庫在Windows上編譯,然后導入到函數中,就會發生錯誤。為了解決這個問題,在創建壓縮包之前,我們需要在Linux上安裝該庫。

這有兩種方法。首先,安裝在帶有Docker的模擬Lambda環境上。對我來說,最簡單的方法是使用AWS sam build命令。函數構建后,我只需從構建文件夾中拷貝所需的包,并將它們作為層來上傳。

  1. sam build --use-container 

4. 啟動Lambda函數來解析新聞源

一旦我們將新聞URL作為主題發送到SNS,就可以觸發多個Lambda從RSS新聞源去獲取新聞文章。一些RSS新聞源不一樣,但新聞源解析器庫允許我們使用不同的格式。我們的URL是事件對象的一部分,所以我們需要通過key來提取它。

  1. import boto3 
  2. import feedparser 
  3. from datetime import datetime 
  4. def lambda_handler(event, context): 
  5.     
  6.     #Connect to DynamoDB 
  7.     dynamodb = boto3.resource('dynamodb'
  8.     # Get table 
  9.     table = dynamodb.Table('news'
  10.      
  11.     # Get a url from from event 
  12.     url = event['Records'][0]['Sns']['Message'
  13.     
  14.     # Parse the rss feed 
  15.     feed = feedparser.parse(url) 
  16.      
  17.     for item in feed['entries']: 
  18.         result = { 
  19.             "news_url": item['link'], 
  20.             "title": item['title'], 
  21.             "created_at": datetime.now().strftime('%Y-%m-%d') # so that dynamodb will be ok with our date 
  22.         } 
  23.          
  24.         # Save the result to dynamodb 
  25.         table.put_item(Item=result, ConditionExpression='attribute_not_exists(news_url)') # store only unique urls 

5. 在Sagemaker上創建和部署文本摘要模型

Sagemaker是一項服務,可讓您輕松在AWS上編寫、訓練和部署機器學習模型。 HuggingFace與AWS合作,使用戶更容易將其模型部署到云端。

這里我在Jupiter notebook中編寫了一個簡單的文本摘要模型,并使用deploy()命令來部署它。

  1. from sagemaker.huggingface import HuggingFaceModel 
  2. import sagemaker 
  3. role = sagemaker.get_execution_role() 
  4. hub = { 
  5.     'HF_MODEL_ID':'facebook/bart-large-cnn'
  6.      'HF_TASK':'summarization' 
  7. # Hugging Face Model Class 
  8. huggingface_model = HuggingFaceModel( 
  9.     transformers_version='4.6.1'
  10.     pytorch_version='1.7.1'
  11.     py_version='py36'
  12.     env=hub, 
  13.     role=role,  
  14. # deploy model to SageMaker Inference 
  15. predictor = huggingface_model.deploy( 
  16.     initial_instance_count=1, # number of instances 
  17.     instance_type='ml.m5.xlarge' # ec2 instance type 

一旦部署完畢,我們可以從Sagemaker -> Inference -> Endpoint configuration獲取端點信息,并用在我們的Lamdas中。

6. 獲取文章的全文、摘要文章并將結果存儲在DynamoDB中

由于版權我們不會存儲全文,這就是為什么所有處理工作都在一個Lambda中進行。一旦URL進入到Dynamo DB表,我啟動了文本處理Lambda。為此,我創建了DynamoDB項生成,作為啟動Lambda的觸發器。我創建了批大小,那樣Lambda每次只處理一篇文章。

  1. import json 
  2. import boto3  
  3. from goose3 import Goose 
  4. from datetime import datetime 
  5. def lambda_handler(event, context): 
  6.     # Get url from DynamoDB record creation event 
  7.     url =  event['Records'][0]['dynamodb']['Keys']['news_url']['S'
  8.      
  9.     # fetch article full text 
  10.     g = Goose() 
  11.     article = g.extract(url=url) 
  12.      
  13.     body = article.cleaned_text # clean article text 
  14.      
  15.     published_date = article.publish_date # from meta desc 
  16.      
  17.     # Create a summary using our HuggingFace text summary model 
  18.     ENDPOINT_NAME = "your_model_endpoint" 
  19.     runtime= boto3.client('runtime.sagemaker'
  20.      
  21.     response = runtime.invoke_endpoint(EndpointName=ENDPOINT_NAME, ContentType='application/json', Body=json.dumps(data)) 
  22.     
  23.     #extract a summary 
  24.     summary = json.loads(response['Body'].read().decode()) 
  25.      
  26.     #Connect to DynamoDB 
  27.     dynamodb = boto3.resource('dynamodb'
  28.     # Get table 
  29.     table = dynamodb.Table('news'
  30.      
  31.     # Update item stored in dynamoDB 
  32.     update = table.update_item( 
  33.         Key = { "news_url": url  } 
  34.         , 
  35.         ConditionExpression= 'attribute_exists(news_url) ',  
  36.         UpdateExpression='SET summary = :val1, published_date = :val2' 
  37.         ExpressionAttributeValues={ 
  38.             ':val1': summary, 
  39.             ':val2': published_date 
  40.         } 
  41.     ) 

這就是我們如何使用AWS工具,構建并部署一個簡單的無服務器數據管道以讀取最新新聞的過程。

原文標題:Build a Serverless News Data Pipeline using ML on AWS Cloud,作者:Maria Zentsova

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

 

責任編輯:華軒 來源: 51CTO
相關推薦

2018-11-28 09:28:28

無服務器架構網絡服務

2016-11-30 10:33:33

云計算AWS

2021-01-20 15:46:11

機器學習人工智能無服務

2018-10-24 12:15:06

無服務器軟件方式

2025-02-14 15:36:05

2015-08-11 09:48:53

2022-10-09 08:08:02

人工智能機器學習平臺

2024-01-02 09:00:00

無服務器架構RASP

2017-08-23 10:28:01

AWS云安全服務

2018-11-02 09:00:15

云端無服務器虛擬機

2022-12-13 10:45:12

無服務器架構物聯網工具

2022-04-25 15:05:33

機器學習人工智能數據集

2019-04-30 10:27:46

無服務器云計算安全

2020-02-19 10:39:44

機器學習云計算數據

2018-10-10 19:39:37

云計算云服務Kubernetes

2018-02-24 10:15:36

無服務器容器云計算

2023-08-29 15:07:35

無服務器計算云計算

2013-08-14 09:30:50

云端裸機服務器

2022-04-08 18:51:43

惡意軟件加密網絡攻擊

2017-06-05 10:08:33

無服務器計算AWS Lambda
點贊
收藏

51CTO技術棧公眾號

国产精品一区二区av白丝下载| 黄色aaaaaa| 天堂在线中文网| 免费视频一区| 色偷偷av亚洲男人的天堂| 小日子的在线观看免费第8集| 国产传媒在线| 国产日本欧美一区二区| caoporn国产精品免费公开| 精品欧美一区二区三区免费观看| 欧美日韩伦理| 欧美精品一区视频| 天天色综合社区| 菠萝蜜视频在线观看www入口| 久久久久久**毛片大全| 亚洲最大福利视频网站| 国产婷婷色一区二区在线观看| 亚欧美无遮挡hd高清在线视频| 亚洲精品www久久久| 亚洲18在线看污www麻豆| 婷婷电影在线观看| 亚洲主播在线观看| 一区二区三区四区在线视频| 亚洲免费黄色片| 久久99国产乱子伦精品免费| 91精品国产自产91精品| 免费在线观看黄视频| 成人激情视频| 亚洲欧美日韩精品久久亚洲区| ass极品水嫩小美女ass| 日韩午夜电影免费看| 色狠狠av一区二区三区| 男人添女人荫蒂免费视频| 日本中文字幕在线看| 久久久久久久综合色一本| 国产精品二区三区| www.蜜臀av| 国产一区二区中文字幕| 国产精品自产拍在线观| 久久草视频在线| 国内视频精品| 久久99精品久久久久久青青91 | 色婷婷成人网| 欧美在线视频不卡| jizz欧美激情18| 性欧美18一19sex性欧美| 富二代精品短视频| 国产va亚洲va在线va| 男女在线视频| 亚洲激情六月丁香| 国产精品啪啪啪视频| 国产人成网在线播放va免费| 一区二区中文视频| 伊人情人网综合| 精品国产99久久久久久| 亚洲精品中文字幕在线观看| 懂色av粉嫩av蜜臀av| 国产剧情在线| 亚洲一区二区三区四区的| 精品一区二区三区无码视频| 日本精品600av| 亚洲一区二区欧美| 黄色国产一级视频| 神马午夜在线视频| 色欧美乱欧美15图片| 成年人免费大片| 成人精品动漫| 91精品久久久久久久99蜜桃| 久热精品在线播放| 成人豆花视频| 亚洲精品一区二区三区99| 中文字幕在线播放视频| 欧美男gay| 日韩一区视频在线| 午夜写真片福利电影网| 最新日韩欧美| 国产91精品最新在线播放| 中文字幕在线观看高清| 精品一区二区三区视频| 成人黄视频免费| 亚洲三区在线观看无套内射| 国产丝袜美腿一区二区三区| 一区二区三区四区| 图片区小说区亚洲| 日韩欧美精品网址| 中文字幕亚洲欧洲| 国内精品偷拍| 国产一区二区三区欧美| 97成人资源站| 欧美亚洲视频| 91人人爽人人爽人人精88v| 免费国产羞羞网站视频| 久久精品人人做人人爽人人| 五月天色婷婷综合| 在线天堂资源| 欧美一区二区成人6969| 亚洲一区二区观看| 亚洲综合中文| 日本中文字幕久久看| 国产精品久久久久久久免费看| 粉嫩av一区二区三区粉嫩| 欧洲精品码一区二区三区免费看| 精品国产白色丝袜高跟鞋| 欧美日韩亚洲系列| 日本特黄在线观看| 九九热线有精品视频99| 欧美激情日韩图片| 在线观看国产一区二区三区| 9人人澡人人爽人人精品| 一区二区不卡视频| 日韩伦理精品| 欧美成人三级在线| 肉色超薄丝袜脚交69xx图片| 亚洲一区一卡| 国产高清精品一区| 69av亚洲| 色综合视频在线观看| 日本人妻一区二区三区| 日韩精品中文字幕第1页| 91精品国产色综合| 好吊色视频一区二区| 亚洲三级在线播放| 一级片视频免费观看| 亚洲精品一级二级三级| 久久久久国产精品免费网站| 国产免费黄色网址| 国产精品美女久久久久久久久| 国产免费黄色av| 91欧美日韩在线| 欧美成人sm免费视频| 一级黄色片在线播放| 国产午夜精品理论片a级大结局| 国产精品12345| 51社区在线成人免费视频| 久久视频在线播放| 国产精品国产一区二区三区四区| 中文字幕巨乱亚洲| 美女网站免费观看视频| 国产欧美一区二区精品久久久| 午夜精品美女自拍福到在线| 亚洲国产精品视频在线| 亚洲精品乱码久久久久| 激情成人在线观看| 亚洲精品久久久| 91在线免费视频| 国产精品va在线观看视色 | 亚洲欧美激情网| 久久99蜜桃| 国产va免费精品高清在线观看 | 久久这里都是精品| 日日摸日日碰夜夜爽av| 日韩大片在线免费观看| 欧美亚洲一级片| 久久经典视频| 欧日韩精品视频| 黄色裸体一级片| 久久国产精品色| 可以免费看的黄色网址| 亚洲成人五区| 午夜精品一区二区三区在线视| 午夜福利理论片在线观看| 婷婷夜色潮精品综合在线| 国产激情视频网站| 三级久久三级久久| 亚洲综合五月天| 国色天香久久精品国产一区| 久久91超碰青草是什么| 三级网站免费观看| 日本精品一区二区三区四区的功能| 国产美女免费网站| 精品在线观看免费| 欧美成人精品免费| 在线日本制服中文欧美| 国产玖玖精品视频| 性欧美1819sex性高清大胸| 欧美精品一区二区在线播放| 青草视频在线观看免费| 国产精品色噜噜| www.日本久久| 在线一区视频| 一区二区精品免费视频| 999久久久精品一区二区| 久久久久久久久久久av| 男人天堂网在线观看| 欧美日韩精品高清| 国产一级在线观看视频| 久久久青草青青国产亚洲免观| 亚洲视频第二页| 亚洲国产黄色| 亚洲视频sss| 精品视频高潮| 国产日韩欧美成人| 欧美aaaaa性bbbbb小妇| 在线免费看av不卡| 日韩中文字幕影院| 欧美日韩国产影片| 毛片视频网站在线观看| 亚洲人成人一区二区在线观看| 久久久久亚洲AV成人无码国产| 美日韩一区二区| 久久成人免费观看| 在线看片不卡| 亚洲高清123| 免费看久久久| 91久久久久久久久久久| 黄瓜视频成人app免费| 欧美激情xxxxx| 99re在线视频| 精品亚洲一区二区| 丰满少妇一级片| 欧美欧美欧美欧美首页| 无码免费一区二区三区| 亚洲1区2区3区4区| 少妇被躁爽到高潮无码文| 国产偷v国产偷v亚洲高清| 欧美熟妇精品一区二区蜜桃视频| 麻豆91精品91久久久的内涵| 99福利在线观看| 欧美特黄a级高清免费大片a级| 亚洲狠狠婷婷综合久久久| 青青一区二区| 国产日韩欧美精品| 视频一区日韩精品| 91色在线观看| 亚州欧美在线| 国产一区二区在线免费| 天堂久久午夜av| 日韩av观看网址| 无遮挡在线观看| 亚洲91精品在线观看| 手机av免费在线| 欧美大奶子在线| 国产成人无吗| 久久精品福利视频| 黄网页免费在线观看| 色婷婷久久一区二区| 尤物网在线观看| 色av中文字幕一区| 91xxx在线观看| 久久精品成人一区二区三区| 69久久精品| 久久精品久久精品亚洲人| 无遮挡的视频在线观看| 色偷偷av一区二区三区| 欧美私人网站| 免费不卡欧美自拍视频| 2024最新电影免费在线观看 | 国产精品99久久久久久成人| 国产精品久久久久久久午夜片| 国产又粗又长免费视频| 国产精品系列在线| 搜索黄色一级片| 日韩理论在线观看| 欧美日韩精品一区二区三区视频播放 | 天天躁日日躁aaaa视频| 久久精子c满五个校花| av黄色在线免费观看| 国产精品久久久久久妇女6080| 欧美xxxooo| 亚洲精品一卡二卡| 日本学生初尝黑人巨免费视频| 欧美日韩国产专区| 中文字幕免费高清网站| 欧美日韩视频一区二区| 国产女人高潮时对白| 日韩欧美一二区| 婷婷在线免费视频| 亚洲色图美腿丝袜| 老司机午夜在线| 欧美国产日韩一区二区在线观看 | 亚洲欧洲日韩| www.日本在线播放| 日本一区中文字幕| 中文字幕第22页| 99久久婷婷国产| 欧美性受xxxx黑人| 亚洲夂夂婷婷色拍ww47| caoporn国产| 在线不卡中文字幕播放| 内射后入在线观看一区| 亚洲三级黄色在线观看| 国产盗摄在线观看| 日本精品视频网站| 国产精品久久久久久av公交车| 国外成人在线视频网站| 精品国产一区二区三区av片| 青青草免费在线视频观看| 夜夜嗨av一区二区三区网站四季av| 在线免费视频a| 国产成人精品影视| 亚洲人成人无码网www国产| 亚洲精品国产无套在线观| 国产又黄又猛又粗又爽| 欧美一区午夜精品| 黄网站在线观看| 欧美极品美女电影一区| 久久天天久久| 久久免费视频1| 欧美成人综合| 特级丰满少妇一级| 97精品国产97久久久久久久久久久久 | 一级特黄aaa| 国产丝袜一区二区| 欧美寡妇性猛交xxx免费| 国产精品亚洲网站| 欧美日韩直播| 日韩一级特黄毛片| 日本视频中文字幕一区二区三区| 在线视频 日韩| 亚洲综合清纯丝袜自拍| 在线视频你懂得| 亚洲欧美综合精品久久成人| 欧美人与禽性xxxxx杂性| 国产欧美久久久久久| 国产成人调教视频在线观看 | 亚洲妇女成熟| 国产成人精品自拍| 综合五月婷婷| www.成年人| 国产精品久久毛片av大全日韩| 51国产偷自视频区视频| 精品国产免费一区二区三区四区| jizz性欧美| 91在线|亚洲| 外国成人免费视频| 色播五月激情五月| 国产欧美日本一区视频| aaa在线视频| 亚洲欧美日韩一区二区在线| 精品人人视频| 精品蜜桃一区二区三区| 一本色道精品久久一区二区三区| 亚洲欧美日韩偷拍| 亚洲国产日韩在线一区模特| 国产偷拍一区二区| 欧美成人在线网站| 日韩第一区第二区| 成人在线免费高清视频| 国产精品香蕉一区二区三区| 黄色片在线观看网站| 欧美一区二区观看视频| av中文字幕在线播放| 91精品网站| 午夜日韩在线| 中国黄色片视频| 亚洲成在线观看| 天堂中文网在线| 国产成人精品在线视频| 国产精品一区高清| 久久精品影视大全| |精品福利一区二区三区| 国产乱码久久久久| 久久99视频精品| 美女午夜精品| 国产xxxxx视频| 国产精品久久久久一区| 国产日韩欧美一区二区东京热| 欧美成人性色生活仑片| 国偷自产av一区二区三区| 日日碰狠狠添天天爽超碰97| 久久久久久亚洲综合| 亚洲网站在线免费观看| 美日韩精品免费视频| 精品三级av| 中文久久久久久| 亚洲欧美色综合| 日本黄色不卡视频| 国产成人在线播放| 欧美一区二区| 国产 中文 字幕 日韩 在线| 欧美性一二三区| 日本大胆在线观看| 欧美日本韩国一区二区三区| 久色婷婷小香蕉久久| 免费在线观看国产精品| 亚洲一品av免费观看| 成人97精品毛片免费看| 自慰无码一区二区三区| 中国av一区二区三区| 懂色av一区二区三区四区| 欧亚精品在线观看| 91精品国产调教在线观看| 亚洲婷婷在线观看| 欧美日韩一区国产| av影视在线| 艳色歌舞团一区二区三区| 成人性生交大片免费看中文| 337p粉嫩色噜噜噜大肥臀| 理论片在线不卡免费观看| 日韩大片在线免费观看| 一二三级黄色片| 色网综合在线观看| 婷婷色在线资源| 亚洲精品一区二区三| 懂色中文一区二区在线播放| www.五月婷婷.com| 97久久久免费福利网址| 五月激情综合| 国产中年熟女高潮大集合| 精品国产一二三|