精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

運(yùn)維人員需知:最佳日志實(shí)踐

運(yùn)維 系統(tǒng)運(yùn)維
日志記錄的好壞直接關(guān)系到系統(tǒng)出現(xiàn)問題時(shí)定位的速度,同時(shí)可以通過(guò)對(duì)日志的觀察和分析,提前發(fā)現(xiàn)系統(tǒng)可能的風(fēng)險(xiǎn),避免線上事故的發(fā)生。我們?cè)陂_發(fā)和運(yùn)維NOS(網(wǎng)易對(duì)象存儲(chǔ),Netease Object Storage)的過(guò)程中,對(duì)整個(gè)系統(tǒng)的日志進(jìn)行了分析優(yōu)化,積累出一些經(jīng)驗(yàn),歸納如下。

前言

日志用來(lái)記錄用戶操作、系統(tǒng)運(yùn)行狀態(tài)等,是一個(gè)系統(tǒng)的重要組成部分。然而由于日志并非系統(tǒng)核心功能,通常情況下并不受團(tuán)隊(duì)的重視。在出現(xiàn)問題需要通過(guò)日志來(lái)定位時(shí),才發(fā)現(xiàn)日志還存在很多問題。

日志記錄的好壞直接關(guān)系到系統(tǒng)出現(xiàn)問題時(shí)定位的速度,同時(shí)可以通過(guò)對(duì)日志的觀察和分析,提前發(fā)現(xiàn)系統(tǒng)可能的風(fēng)險(xiǎn),避免線上事故的發(fā)生。

我們?cè)陂_發(fā)和運(yùn)維NOS(網(wǎng)易對(duì)象存儲(chǔ),Netease Object Storage)的過(guò)程中,對(duì)整個(gè)系統(tǒng)的日志進(jìn)行了分析優(yōu)化,積累出一些經(jīng)驗(yàn),歸納如下。

相關(guān)問題經(jīng)驗(yàn)整理

1. 關(guān)于日志級(jí)別

我們通常使用的日志庫(kù)(如log4j等),將日志基本分為以下幾類(從低到高):

  1. TRACE - The TRACE Level designates finer-grained informational events than the DEBUG 
  2. DEBUG – The DEBUG Level designates fine-grained informational events that are most useful to debug an application. 
  3. INFO - The INFO level designates informational messages that highlight the progress of the application at coarse-grained level. 
  4. WARN - The WARN level designates potentially harmful situations. 
  5. ERROR - The ERROR level designates error events that might still allow the application to continue running. 
  6. FATAL - The FATAL level designates very severe error events that will presumably lead the application to abort. 

盡管log4j官方文檔對(duì)各個(gè)日志級(jí)別進(jìn)行了簡(jiǎn)單定義。然而在實(shí)踐中,究竟哪些操作需要記入日志,哪種錯(cuò)誤應(yīng)該記為WARN級(jí)別,而哪種錯(cuò)誤又為ERROR級(jí)別,還需要進(jìn)行進(jìn)一步討論。

關(guān)于該問題,在StackOverflow上有一個(gè)討論貼進(jìn)行過(guò)討論。

此處對(duì)貼子中的一些觀點(diǎn),加上我們?cè)谄綍r(shí)運(yùn)維過(guò)程中遇到的相關(guān)問題進(jìn)行歸納:

  • 一個(gè)項(xiàng)目各個(gè)log級(jí)別的定義應(yīng)該是清楚明確的,是每個(gè)開發(fā)人員所遵循的;
  • 即使是TRACE或者DEBUG級(jí)別的日志,也應(yīng)該有一定的規(guī)范,要保證除了開發(fā)人員自己以外,包括測(cè)試人員和運(yùn)維人員都可以方便地通過(guò)日志定位問題;
  • 對(duì)于日志級(jí)別的分類,有以下參考:
    FATAL — 表示需要立即被處理的系統(tǒng)級(jí)錯(cuò)誤。當(dāng)該錯(cuò)誤發(fā)生時(shí),表示服務(wù)已經(jīng)出現(xiàn)了某種程度的不可用,系統(tǒng)管理員需要立即介入。這屬于最嚴(yán)重的日志級(jí)別,因此該日志級(jí) 別必須慎用,如果這種級(jí)別的日志經(jīng)常出現(xiàn),則該日志也失去了意義。通常情況下,一個(gè)進(jìn)程的生命周期中應(yīng)該只記錄一次FATAL級(jí)別的日志,即該進(jìn)程遇到無(wú) 法恢復(fù)的錯(cuò)誤而退出時(shí)。當(dāng)然,如果某個(gè)系統(tǒng)的子系統(tǒng)遇到了不可恢復(fù)的錯(cuò)誤,那該子系統(tǒng)的調(diào)用方也可以記入FATAL級(jí)別日志,以便通過(guò)日志報(bào)警提醒系統(tǒng)管 理員修復(fù);
    ERROR — 該級(jí)別的錯(cuò)誤也需要馬上被處理,但是緊急程度要低于FATAL級(jí)別。當(dāng)ERROR錯(cuò)誤發(fā)生時(shí),已經(jīng)影響了用戶的正常訪問。從該意義上來(lái)說(shuō),實(shí)際上 ERROR錯(cuò)誤和FATAL錯(cuò)誤對(duì)用戶的影響是相當(dāng)?shù)摹ATAL相當(dāng)于服務(wù)已經(jīng)掛了,而ERROR相當(dāng)于好死不如賴活著,然而活著卻無(wú)法提供正常的服 務(wù),只能不斷地打印ERROR日志。特別需要注意的是,ERROR和FATAL都屬于服務(wù)器自己的異常,是需要馬上得到人工介入并處理的。而對(duì)于用戶自己 操作不當(dāng),如請(qǐng)求參數(shù)錯(cuò)誤等等,是絕對(duì)不應(yīng)該記為ERROR日志的;
    WARN — 該日志表示系統(tǒng)可能出現(xiàn)問題,也可能沒有,這種情況如網(wǎng)絡(luò)的波動(dòng)等。對(duì)于那些目前還不是錯(cuò)誤,然而不及時(shí)處理也會(huì)變?yōu)殄e(cuò)誤的情況,也可以記為WARN日 志,例如一個(gè)存儲(chǔ)系統(tǒng)的磁盤使用量超過(guò)閥值,或者系統(tǒng)中某個(gè)用戶的存儲(chǔ)配額快用完等等。對(duì)于WARN級(jí)別的日志,雖然不需要系統(tǒng)管理員馬上處理,也是需要 即使查看并處理的。因此此種級(jí)別的日志也不應(yīng)太多,能不打WARN級(jí)別的日志,就盡量不要打;
    INFO — 該種日志記錄系統(tǒng)的正常運(yùn)行狀態(tài),例如某個(gè)子系統(tǒng)的初始化,某個(gè)請(qǐng)求的成功執(zhí)行等等。通過(guò)查看INFO級(jí)別的日志,可以很快地對(duì)系統(tǒng)中出現(xiàn)的 WARN,ERROR,FATAL錯(cuò)誤進(jìn)行定位。INFO日志不宜過(guò)多,通常情況下,INFO級(jí)別的日志應(yīng)該不大于TRACE日志的10%;
    DEBUG or TRACE — 這兩種日志具體的規(guī)范應(yīng)該由項(xiàng)目組自己定義,該級(jí)別日志的主要作用是對(duì)系統(tǒng)每一步的運(yùn)行狀態(tài)進(jìn)行精確的記錄。通過(guò)該種日志,可以查看某一個(gè)操作每一步的執(zhí) 行過(guò)程,可以準(zhǔn)確定位是何種操作,何種參數(shù),何種順序?qū)е铝四撤N錯(cuò)誤的發(fā)生。可以保證在不重現(xiàn)錯(cuò)誤的情況下,也可以通過(guò)DEBUG(或TRACE)級(jí)別的 日志對(duì)問題進(jìn)行診斷。需要注意的是,DEBUG日志也需要規(guī)范日志格式,應(yīng)該保證除了記錄日志的開發(fā)人員自己外,其他的如運(yùn)維,測(cè)試人員等也可以通過(guò) DEBUG(或TRACE)日志來(lái)定位問題;

Rule 1:整個(gè)團(tuán)隊(duì)(包括運(yùn)維人員)需要對(duì)日志級(jí)別有明確的規(guī)定,什么日志記入什么級(jí)別的日志,什么級(jí)別的錯(cuò)誤出現(xiàn)要如何處理等

2. 對(duì)記錄的日志要進(jìn)行更新維護(hù)

由于DEBUG(或TRACE)級(jí)別的日志對(duì)于定位問題至關(guān)重要,因此該種日志記錄是否完備且不冗余、格式是否規(guī)范等也需要花費(fèi)大量精力來(lái)優(yōu)化。此處有以下幾個(gè)比較好的實(shí)踐:

  • 定義好整個(gè)團(tuán)隊(duì)記錄DEBUG(或TRACE)日志的規(guī)范,保證每個(gè)開發(fā)記錄的日志格式統(tǒng)一;
  • 整個(gè)團(tuán)隊(duì)(包括開發(fā),運(yùn)維和測(cè)試)定期對(duì)記錄的日志內(nèi)容進(jìn)行Review;
  • 開發(fā)做運(yùn)維,通過(guò)在查問題的過(guò)程來(lái)優(yōu)化日志記錄的方式;
  • 運(yùn)維或測(cè)試在日志中發(fā)現(xiàn)的問題,都需要及時(shí)向開發(fā)人員反映;

Rule 2:需要定期對(duì)日志內(nèi)容進(jìn)行優(yōu)化更新,目的就是通過(guò)日志快速準(zhǔn)確的定位問題

3. 關(guān)于日志分類

日志從功能來(lái)說(shuō),可分為診斷日志、統(tǒng)計(jì)日志、審計(jì)日志。

診斷日志, 典型的有:

  • 請(qǐng)求入口和出口
  • 外部服務(wù)調(diào)用和返回
  • 資源消耗操作: 打開文件等
  • 容錯(cuò)行為: 譬如云硬盤的副本修復(fù)操作
  • 程序異常: 譬如數(shù)據(jù)庫(kù)無(wú)法連接
  • 后臺(tái)操作:清理程序
  • 啟動(dòng)、關(guān)閉、配置加載
  • 拋出異常時(shí),不記錄日志

統(tǒng)計(jì)日志:

  • 用戶訪問統(tǒng)計(jì)
  • 計(jì)費(fèi)日志(如記錄用戶使用的網(wǎng)絡(luò)資源或磁盤占用,格式較為嚴(yán)格,便于統(tǒng)計(jì))

審計(jì)日志:

  • 管理操作

將不同需求的日志記入到不同的日志文件中,可以方便相關(guān)問題(管理平臺(tái)操作審計(jì),用戶操作計(jì)費(fèi)等)的處理。針對(duì)每一種需求,需要對(duì)日志的格式,日志記錄的內(nèi)容等進(jìn)行特別的記錄。

Rule 3:要明確不同日志的用途,對(duì)日志內(nèi)容進(jìn)行分類

4. 日志中不要記錄無(wú)用信息

在很多應(yīng)用中,用戶都需要通過(guò)Fuse方式來(lái)掛載使用NOS。

POSIX標(biāo)準(zhǔn)中文件系統(tǒng)接口不允許文件 /a 與目錄 /a/ 同時(shí)存在,而NOS作為對(duì)象存儲(chǔ)系統(tǒng),/a 和 /a/是不同的對(duì)象,是能夠同時(shí)存在的,一般地,NOS 中我們會(huì)規(guī)定 /a/ 是目錄,/a 是文件,目錄對(duì)象大小為0。

POSIX標(biāo)準(zhǔn)對(duì)文件的getattr操作,無(wú)論是 /a 還是 /a/,對(duì)應(yīng)的請(qǐng)求都是 /a。為了避免遺漏,需分別向 NOS 請(qǐng)求 HeadObject(“/a“)和 HeadObject(“/a/“)。如果命中/a,說(shuō)明 /a 是一個(gè)文件,不用再請(qǐng)求 getattr(“/a/“)。

因此當(dāng)用戶訪問 */a/b/c.txt* 時(shí),實(shí)際上向NOS發(fā)送了以下請(qǐng)求:
# HeadObject(“/a”)
# HeadObject(“/a/”)
# HeadObject(“/a/b”)
# HeadObject(“/a/b/”)
# HeadObject(“/a/b/c.txt”)

對(duì)于上面的請(qǐng)求,實(shí)際上HeadObject(“/a”)和HeadObject(“/a/b”)都會(huì)返回NoSuchKey錯(cuò)誤,而Fuse正是該錯(cuò)誤來(lái)判斷該文件不存在,而可能是個(gè)目錄的。

然而對(duì)于NOS來(lái)說(shuō),這將導(dǎo)致產(chǎn)生大量無(wú)意義的NoSuchKey日志(整個(gè)日志文件的80%都是該錯(cuò)誤日志)。這些日志對(duì)于開發(fā)人員進(jìn)行日志觀察,運(yùn)維人員定位問題,日志監(jiān)控等都造成了困難。

Rule 4: 絕不要打印沒有用的日志,防止無(wú)用日志淹沒重要信息

解決辦法:Fuse請(qǐng)求時(shí),在Http頭部加入 User-Agent 字段,當(dāng)NOS發(fā)現(xiàn)請(qǐng)求是 Fuse發(fā)過(guò)來(lái)的且為HeadObject操作且為NoSuchKey錯(cuò)誤時(shí),則不打印錯(cuò)誤日志。

5. 日志記錄信息要完整

問題描述:

NOS提供分塊上傳的接口,用戶可以通過(guò)以下的調(diào)用序列,來(lái)實(shí)現(xiàn)一次分塊上傳的流程:

  • InitMultiUpload(生成一個(gè)UploadID)
  • UploadPart
  • UploadPart
  •  ……
  • UploadPart
  • CompleteMultiUpload(AbortMultiUpload)

之前在某個(gè)產(chǎn)品上線初期,由于其開發(fā)人員對(duì)NOS的熟悉程度不夠等原因。出現(xiàn)過(guò)如下問題:客戶端常常會(huì)收到NoSuchUpload的錯(cuò)誤。該錯(cuò)誤 出現(xiàn)的原因是,用戶在未調(diào)用InitMultiUpload之前,或者在調(diào)用了 CompleteMultiUpload(AbortMultiUpload)之后再次調(diào)用UploadPart。

然而當(dāng)我們查日志,希望可以看到該UploadPart請(qǐng)求對(duì)哪個(gè)UploadID進(jìn)行操作,該UploadID又對(duì)應(yīng)哪些操作時(shí),卻發(fā)現(xiàn)我們的日志中沒有記錄UploadPart請(qǐng)求對(duì)應(yīng)的UploadID。

類似的問題還有很多,很多針對(duì)特定請(qǐng)求的日志缺失,導(dǎo)致很多問題無(wú)法定位。

因此,需要進(jìn)一步對(duì)日志中需要記錄哪些內(nèi)容進(jìn)行規(guī)定,此處推薦的需要在日志中記錄的內(nèi)容有:

  • 在系統(tǒng)啟動(dòng)或初始化時(shí)記錄重要的系統(tǒng)初始化參數(shù)
  • 記錄系統(tǒng)運(yùn)行過(guò)程中的所有的錯(cuò)誤
  • 記錄系統(tǒng)運(yùn)行過(guò)程中的所有的警告
  • 在持久化數(shù)據(jù)修改時(shí)記錄修改前和修改后的值
  • 記錄系統(tǒng)各主要模塊之間的請(qǐng)求和響應(yīng)(如在NOS中的視頻處理模塊在接收到請(qǐng)求和發(fā)送應(yīng)答時(shí),或者向客戶端發(fā)送回調(diào)請(qǐng)求時(shí))
  • 重要的狀態(tài)變化(如NOS中對(duì)系統(tǒng)白名單的修改等)
  • 系統(tǒng)中一些長(zhǎng)期執(zhí)行的任務(wù)的執(zhí)行進(jìn)度

而不推薦記錄日志的內(nèi)容有:

  • 函數(shù)入口信息 —— 除非該函數(shù)入口表示了一個(gè)重要事件的開始,或者將該信息記入DEBUG級(jí)別日志
  • 文件內(nèi)容或者一大段消息的內(nèi)容 —— 如果實(shí)在需要記錄,則可以截取其中一些重要的信息來(lái)記入日志
  • “良性”錯(cuò)誤 —— 有時(shí)候雖然出現(xiàn)了錯(cuò)誤,然而錯(cuò)誤處理的流程可以正確解決這種情況,例如插入數(shù)據(jù)庫(kù)時(shí)有重復(fù)的記錄,盡管是個(gè)錯(cuò)誤,然而錯(cuò)誤處理流程可以對(duì)這種情況進(jìn)行處理

Rule 5:日志信息要準(zhǔn)確全面,能做到僅憑日志就可以定位問題

解決辦法:整理所有的請(qǐng)求處理流程,針對(duì)每一個(gè)操作(去重,分塊上傳……)打印特定的日志。

6. 測(cè)試的日志

測(cè)試代碼(單元測(cè)試,接口測(cè)試……)的日志同樣重要。特別是,當(dāng)一個(gè)測(cè)試失敗時(shí),可以通過(guò)日志很快確定是測(cè)試代碼有問題,還是系統(tǒng)出現(xiàn)了故障,如果做不到這一點(diǎn),那就需要優(yōu)化測(cè)試的日志了。

測(cè)試日志應(yīng)該包含以下內(nèi)容:

  • 測(cè)試執(zhí)行的環(huán)境
  • 測(cè)試執(zhí)行前的初始狀態(tài)
  • 測(cè)試的詳細(xì)步驟
  • 測(cè)試和系統(tǒng)的交互信息
  • 測(cè)試期望的返回結(jié)果
  • 測(cè)試實(shí)際的返回結(jié)果

Rule 6:要以同樣嚴(yán)格的要求對(duì)待測(cè)試程序的日志

7. 從問題中完善日志

在線上出現(xiàn)問題的時(shí)候,需要盡快發(fā)現(xiàn)問題并解決,而同時(shí),需要借此機(jī)會(huì)好好思考一下當(dāng)前系統(tǒng)的日志是否合理。需要考慮以下問題:

  • 如果定位問題花費(fèi)了很長(zhǎng)時(shí)間,那就說(shuō)明系統(tǒng)日志還存在問題,需要進(jìn)一步完善和優(yōu)化
  • 需要思考是否可以通過(guò)優(yōu)化日志,來(lái)提前預(yù)判該問題是否可能發(fā)生(如某種資源耗盡而導(dǎo)致的錯(cuò)誤,可以對(duì)資源的使用情況進(jìn)行記錄)

通過(guò)系統(tǒng)出現(xiàn)的問題來(lái)優(yōu)化日志,應(yīng)該是一項(xiàng)長(zhǎng)期的實(shí)踐,不斷地從日志發(fā)現(xiàn)系統(tǒng)的問題,不斷地從系統(tǒng)異常發(fā)現(xiàn)日志的問題。

Rule 7:日志的優(yōu)化是一件持續(xù)不斷需要投入精力的事,需要不斷從錯(cuò)誤中學(xué)習(xí)

8. 關(guān)于RequestID

RequestID的生成:

如今NOS有8臺(tái)機(jī)器,共40個(gè)tomcat對(duì)外提供服務(wù)。通常用戶在請(qǐng)求出錯(cuò)的時(shí)候,我們都希望用戶告訴我們請(qǐng)求的RequestID,以此我們可以確定請(qǐng)求是在哪臺(tái)機(jī)器上進(jìn)行處理的。

NOS通過(guò)以下信息生成一個(gè)請(qǐng)求的RequestID:

  • 收到請(qǐng)求的時(shí)間
  • 處理請(qǐng)求的服務(wù)器ip地址
  • 隨機(jī)數(shù)

因此我們可以通過(guò)一個(gè)簡(jiǎn)單的程序從RequestID中得到該請(qǐng)求的處理時(shí)間和處理請(qǐng)求的服務(wù)器地址,更方便的去查看日志:

  1. ./decode.sh 4b2c009a0a7800000142789f42b8ca96 
  2.  Thu Nov 21 11:06:12 CST 2013 
  3.  10.120.202.150 
  4.  4b2c009a 
 

Rule 8:在RequestID中盡量編碼更多的信息。

用RequestID將請(qǐng)求的處理流程關(guān)聯(lián)起來(lái):

在NOS性能測(cè)試中,之前存在的一個(gè)問題是,由于在打印錯(cuò)誤堆棧的地方,并沒有打印請(qǐng)求的RequestID,因此當(dāng)一個(gè)請(qǐng)求出現(xiàn)錯(cuò)誤時(shí),很難(日志量太大)將該請(qǐng)求的錯(cuò)誤堆棧和具體的請(qǐng)求關(guān)聯(lián)起來(lái)。

另一個(gè)問題是,NOS后端有視頻服務(wù)器集群和圖片處理服務(wù)器集群。因此我們可能會(huì)有以下需求:當(dāng)用戶視頻截圖失敗時(shí),用戶會(huì)告訴我們請(qǐng)求的 RequestID,由于NOS并沒有將該RequestID轉(zhuǎn)發(fā)到后端的圖片處理服務(wù)器,因此無(wú)法利用該信息去查看視頻處理服務(wù)器上的日志,而需要通過(guò) 用戶請(qǐng)求的URL進(jìn)行查找。同時(shí),由于我們無(wú)法知道該請(qǐng)求是在哪個(gè)具體的視頻處理的worker上進(jìn)行,進(jìn)一步導(dǎo)致查找日志的困難。

還有一個(gè)潛在的問題是:如果NOS將所有的日志收集起來(lái)(tomcat,圖片處理集群,視頻處理集群……),我們無(wú)法做到通過(guò)requestID來(lái)查找一個(gè)請(qǐng)求的處理流程。

Rule 9:將一個(gè)請(qǐng)求的整個(gè)處理流程和唯一的requestID關(guān)聯(lián)起來(lái)

9. 關(guān)于線上機(jī)器的日志級(jí)別

問題描述:

NOS的DEBUG日志非常詳細(xì)的記錄了請(qǐng)求處理相關(guān)信息,然而由于DEBUG日志量太大,因此通常線上只開INFO級(jí)別日志。然而INFO級(jí)別的 日志卻有可能導(dǎo)致部分問題無(wú)法定位。NOS線上一個(gè)請(qǐng)求可能隨機(jī)地分發(fā)到4臺(tái)機(jī)器進(jìn)行處理,因此如果某一種錯(cuò)誤在一段時(shí)間內(nèi)多次出現(xiàn),它也會(huì)在4臺(tái)服務(wù)器 上都出現(xiàn)。

因此我們推薦的做法是,選擇一臺(tái)機(jī)器開啟DEBUG級(jí)別的日志,方便定位問題。其實(shí)該做法背后的目的是,在線上任何問題的時(shí)候,都可以通過(guò)日志最快的找到問題的根源。

Rule 10:讓一臺(tái)機(jī)器開啟DEBUG日志

10. 上線后的日志觀察

隨著NOS開始服務(wù)越來(lái)越多的產(chǎn)品,NOS每次版本升級(jí)之后,通過(guò)對(duì)日志的觀察來(lái)確定服務(wù)是否正常變得至關(guān)重要。同時(shí)在上線新功能時(shí),來(lái)發(fā)人員需要通過(guò)觀察一些特定的日志,來(lái)確定新功能是否工作正常。

舉例來(lái)說(shuō):

NOS在實(shí)現(xiàn)了桶表緩存的功能之后,首先上線一臺(tái)服務(wù)器,并對(duì)該功能是否工作正常進(jìn)行觀察。通過(guò)將桶緩存的所有操作(如插入,查找,過(guò)期刪除等)以 及桶緩存的狀態(tài)(如緩存桶數(shù)量)都記錄在DEBUG級(jí)別的日志中。將新上線的機(jī)器的日志級(jí)別調(diào)為DEBUG,并對(duì)桶緩存的相關(guān)操作是否正確,緩存桶數(shù)量等 信息進(jìn)行觀察,確認(rèn)一切正常之后再上線其他機(jī)器。

Rule 11:新上線服務(wù)器后一定要對(duì)日志進(jìn)行觀察,特別地,開發(fā)人員可以通過(guò)觀察日志來(lái)確認(rèn)新功能是否工作正常

11. 慢操作日志

NOS在接收到一個(gè)請(qǐng)求的時(shí)候,會(huì)記錄請(qǐng)求的接收時(shí)間(T1),在請(qǐng)求處理完成待發(fā)送的時(shí)候,會(huì)記錄請(qǐng)求發(fā)送時(shí)間(T2),通常一個(gè)請(qǐng)求的日志都記 為INFO級(jí)別,然而當(dāng)出現(xiàn)請(qǐng)求處理時(shí)間(T2-T1)超過(guò)一定時(shí)間(如10s)時(shí),會(huì)將該日志提升為WARN級(jí)別。通過(guò)該方法,可以預(yù)先發(fā)現(xiàn)系統(tǒng)可能存 在的一些問題。

同樣的慢操作日志還可以用來(lái)記錄系統(tǒng)一些外部依賴的處理時(shí)間,如NOS依賴外部認(rèn)證服務(wù)器來(lái)進(jìn)行認(rèn)證。我們會(huì)記錄每個(gè)請(qǐng)求的認(rèn)證時(shí)間,如果認(rèn)證時(shí)間超過(guò)某個(gè)值,也需要將該事件的日志級(jí)別進(jìn)行提升,這樣我們可以盡早發(fā)現(xiàn)認(rèn)證服務(wù)器是不是需要擴(kuò)容等問題。

慢日志的時(shí)間閥值應(yīng)該是可以動(dòng)態(tài)調(diào)整的,這樣在進(jìn)行系統(tǒng)優(yōu)化時(shí),可以將該報(bào)警時(shí)間閥值逐漸調(diào)小,不斷地對(duì)系統(tǒng)進(jìn)行優(yōu)化。

Rule 12:通過(guò)日志級(jí)別的提升來(lái)發(fā)現(xiàn)潛在問題

12. 日志報(bào)警

錯(cuò)誤日志報(bào)警:

NOS通過(guò)[運(yùn)維平臺(tái)|https://m.hz.netease.com/]設(shè)置了日志監(jiān)控報(bào)警,周期性的(1分鐘,5分鐘)對(duì)服務(wù)器新產(chǎn)生的日 志進(jìn)行監(jiān)控,如果發(fā)現(xiàn)錯(cuò)誤數(shù)超過(guò)某個(gè)閥值,則進(jìn)行報(bào)警。這類報(bào)警通常不一定是我們服務(wù)本身的問題,也有可能是用戶使用NOS不當(dāng)造成的。

此處需要注意的問題是,日志報(bào)警相當(dāng)于grep操作,如果日志量過(guò)大,或者匹配規(guī)則過(guò)多,可能對(duì)線上的服務(wù)產(chǎn)生影響。因此在設(shè)置好日志報(bào)警后,需要周期性的關(guān)注每次日志掃描的時(shí)間,評(píng)估日志監(jiān)控是否對(duì)服務(wù)產(chǎn)生影響。

Rule 13:對(duì)日志進(jìn)行監(jiān)控報(bào)警,比客戶先發(fā)現(xiàn)系統(tǒng)問題

關(guān)鍵字報(bào)警:

NOS為每個(gè)用戶分配了一定量的存儲(chǔ)配額,當(dāng)用戶容量超限時(shí),會(huì)限制用戶的上傳操作。通過(guò)在日志中記錄關(guān)鍵字,如“Quota Warning”等,可以及時(shí)提醒用戶進(jìn)行擴(kuò)容,避免用戶服務(wù)中斷。

類似的關(guān)鍵字報(bào)警還有很多:如對(duì)InternalError的數(shù)量進(jìn)行監(jiān)控,對(duì)緩存的桶數(shù)量進(jìn)行監(jiān)控等等。

Rule 14:通過(guò)日志中的關(guān)鍵字來(lái)確定系統(tǒng)的運(yùn)行狀態(tài)

13. 關(guān)于日志格式

日志格式一定要統(tǒng)一,不能任由開發(fā)人員的喜好來(lái)。舉例來(lái)說(shuō),對(duì)于NOS視頻截圖超時(shí)的ERROR日志,有以下幾種方式打印:

***種:
logger.error(“Gearman timeout exception for request ” + getRequestID() + ” value: ” + value, e);

第二種:
logger.error(“RequestID: ” + getRequestID() + “, Error Message: Gearman timeout exception: ” + e);

第三種:
logger.error(getErrorMessage(getRequestID(), getErrorMessage(), e));

***種方式打印日志即是開發(fā)人員按照自己的喜好來(lái)的,這種方法帶來(lái)的問題是:

  • 系統(tǒng)中日志格式不統(tǒng)一,不利于自動(dòng)化處理
  • 有些日志可能只有開發(fā)人員自己才能看懂
  • 代碼規(guī)范性不好

而第三種方式,通過(guò)一個(gè)函數(shù)來(lái)規(guī)范日志格式,所有開發(fā)人員便可以通過(guò)該接口實(shí)現(xiàn)統(tǒng)一的日志。

Rule 15:日志格式要統(tǒng)一規(guī)范

14. 錯(cuò)誤日志輸出到不同文件

在性能測(cè)試中遇到的另一個(gè)問題是,當(dāng)并發(fā)量很大時(shí),可能會(huì)有一些請(qǐng)求處理失敗(如0.5%),為了對(duì)這些錯(cuò)誤進(jìn)行分析,需要去查這些錯(cuò)誤請(qǐng)求的日志。而由于這種情況下并發(fā)量很大,使得對(duì)錯(cuò)誤日志的分析變得困難。

這種情況下可以將所有的錯(cuò)誤日志同時(shí)輸出到一個(gè)單獨(dú)的文件之中。

Rule 16:將錯(cuò)誤日志輸出到一個(gè)單獨(dú)的文件中進(jìn)行分析

15. 關(guān)于日志文件大小

日志文件不宜過(guò)大,過(guò)大的日志文件對(duì)于日志監(jiān)控,問題定位等都會(huì)帶來(lái)不便。因此需要進(jìn)行日志文件的切分,日志文件的切分可以通過(guò)log4j等日志工具來(lái)配置,日志文件應(yīng)該按天來(lái)分割,還是按照小時(shí)來(lái)分割,應(yīng)該根據(jù)日志量來(lái)決定,原則就是方便開發(fā)或運(yùn)維人員能快速查找日志。

為了防止日志文件將整個(gè)磁盤空間占滿,需要定期對(duì)日志文件進(jìn)行刪除。例如,在收到磁盤報(bào)警時(shí),可以將兩個(gè)月以前的日志文件刪除。此處比較好的實(shí)踐是:

  • 將所有日志文件收集起來(lái),這樣即使在記錄日志的機(jī)器上刪除,也可以通過(guò)收集的日志對(duì)之前的問題進(jìn)行定位;
  • 每天通過(guò)定時(shí)任務(wù)來(lái)刪除過(guò)期日志,如每天在凌晨4點(diǎn)刪除60天前的日志

log4j關(guān)于日志切分的相關(guān)配置,可以參考這篇文章

Rule 17:要把日志的大小,如何切分,如何刪除等作為規(guī)范建立起來(lái)

經(jīng)驗(yàn)匯總

此處對(duì)以上總結(jié)的所有經(jīng)驗(yàn)進(jìn)行匯總:

  • 整個(gè)團(tuán)隊(duì)(包括運(yùn)維人員)需要對(duì)日志級(jí)別有明確的規(guī)定,什么日志記入什么級(jí)別的日志,什么級(jí)別的錯(cuò)誤出現(xiàn)要如何處理等
  • 需要定期對(duì)日志內(nèi)容進(jìn)行優(yōu)化更新,目的就是通過(guò)日志快速準(zhǔn)確的定位問題
  • 要明確不同日志的用途,對(duì)日志內(nèi)容進(jìn)行分類
  • 絕不要打印沒有用的日志,防止無(wú)用日志淹沒重要信息
  • 日志信息要準(zhǔn)確全面,努力做到僅憑日志就可以定位問題
  • 要以同樣嚴(yán)格的要求對(duì)待測(cè)試程序的日志
  • 日志的優(yōu)化是一件持續(xù)不斷需要投入精力的事,需要不斷從錯(cuò)誤中學(xué)習(xí)
  • 在RequestID中盡量編碼更多的信息
  • 將一個(gè)請(qǐng)求的整個(gè)處理流程和唯一的requestID關(guān)聯(lián)起來(lái)
  • 讓一臺(tái)機(jī)器開啟DEBUG日志
  • 新上線服務(wù)器后一定要對(duì)日志進(jìn)行觀察,特別地,開發(fā)人員可以通過(guò)觀察日志來(lái)確認(rèn)新功能是否工作正常
  • 通過(guò)日志級(jí)別的提升來(lái)發(fā)現(xiàn)潛在問題
  • 對(duì)日志進(jìn)行監(jiān)控報(bào)警,比客戶先發(fā)現(xiàn)系統(tǒng)問題
  • 通過(guò)日志中的關(guān)鍵字來(lái)確定系統(tǒng)的運(yùn)行狀態(tài)
  • 日志格式要統(tǒng)一規(guī)范
  • 將錯(cuò)誤日志輸出到一個(gè)單獨(dú)的文件中進(jìn)行分析
  • 要把日志的大小,如何切分,如何刪除等作為規(guī)范建立起來(lái)

參考文獻(xiàn)

[1]  ”Optimal Logging” Anthony Vallone from Google

http://googletesting.blogspot.jp/2013/06/optimal-logging.html

責(zé)任編輯:黃丹 來(lái)源: bitstech.net
相關(guān)推薦

2013-06-09 10:38:54

IT運(yùn)維管理運(yùn)維管理ITIL管理

2025-09-28 01:44:00

Airflow運(yùn)維監(jiān)控

2015-07-23 08:48:29

運(yùn)維

2015-02-04 11:45:52

高效運(yùn)維

2015-08-29 13:03:24

運(yùn)維技術(shù)沙龍MDSA

2017-07-25 10:53:27

2015-11-03 16:03:09

AppDeploy運(yùn)維工具

2013-03-29 09:15:08

IT運(yùn)維運(yùn)維人員運(yùn)維工程師

2015-08-05 09:53:34

運(yùn)維自動(dòng)化

2018-04-10 09:49:17

IT運(yùn)維人員京東運(yùn)維體系

2018-03-27 16:23:53

運(yùn)維AI智能

2012-06-28 11:35:27

BSM北塔軟件

2015-09-01 09:23:38

360網(wǎng)絡(luò)運(yùn)維

2010-01-28 10:09:27

IT運(yùn)維人員

2017-10-09 09:12:35

攜程運(yùn)維架構(gòu)

2016-01-12 11:38:19

智能化運(yùn)維運(yùn)維業(yè)務(wù)

2010-08-12 15:38:39

IT運(yùn)維網(wǎng)管軟件摩卡軟件

2017-05-16 14:25:35

運(yùn)維云服務(wù)DevOps

2025-04-30 05:00:00

批量運(yùn)維系統(tǒng)

2010-07-02 09:17:29

技能運(yùn)維人員
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

熟女性饥渴一区二区三区| 成人欧美一区二区三区在线观看| 中文字幕第4页| 成人免费视频观看| 亚洲精品自拍动漫在线| 国产精品区一区| 91黑人精品一区二区三区| 99国产精品免费视频观看| 日韩女同互慰一区二区| 亚洲熟妇av一区二区三区| 男人在线资源站| 成人av电影在线网| 国产日韩欧美视频| 国产尤物在线视频| 久久久人成影片免费观看| 亚洲激情在线观看视频免费| 日韩一区二区三区不卡视频| 欧美另类tv| 国产日韩欧美电影| 国产欧美日本在线| 国产孕妇孕交大片孕| 国产农村妇女毛片精品久久莱园子| 伊人久久男人天堂| 美女扒开腿免费视频| 粉嫩91精品久久久久久久99蜜桃| 午夜精品久久久久久久| 黄瓜视频免费观看在线观看www | 日韩国产欧美在线观看| 欧美久久精品午夜青青大伊人| 在线免费观看黄色小视频| 韩国三级大全久久网站| 欧美视频一区二区三区四区| 国产3p露脸普通话对白| 成人日韩欧美| 中文字幕精品—区二区四季| 久久99欧美| 亚洲精品一级片| 久久99在线观看| 奇米四色中文综合久久| 青青操免费在线视频| 欧美在线不卡| 精品国产美女在线| 蜜桃久久精品成人无码av| 乱亲女h秽乱长久久久| 日韩欧美在线一区二区三区| 亚洲一区日韩精品| 国模一区二区| 在线影院国内精品| 免费激情视频在线观看| 欧美香蕉视频| 色哟哟一区二区在线观看| 国产中文字幕二区| 波多野结衣在线观看| 樱桃国产成人精品视频| 欧美少妇在线观看| 亚洲图区一区| 亚洲欧美国产毛片在线| 中文字幕一区二区三区最新| 最新97超碰在线| 国产精品剧情在线亚洲| 亚洲国产精品一区二区第四页av| 国产精品一级伦理| 国产欧美1区2区3区| 日韩福利视频| 伊人免费在线| 亚洲婷婷综合久久一本伊一区| 日韩精品一区二区三区外面| 午夜伦全在线观看| 亚洲男人天堂av| 中文字幕日韩精品无码内射| 丝袜国产在线| 天涯成人国产亚洲精品一区av| www.日本在线播放| 在线成人av观看| 色乱码一区二区三区88| 色乱码一区二区三区在线| 日韩毛片免费看| 日韩欧美国产一区二区在线播放| 成年人性生活视频| 欧美aaaaa级| 亚洲日韩第一页| 波兰性xxxxx极品hd| 亚洲情侣在线| 国外成人在线直播| 日本黄色一级视频| 久久国产精品区| 97av影视网在线观看| 黄色av小说在线观看| www国产成人| 亚洲一区bb| 污污影院在线观看| 富二代精品短视频| 污污网站在线观看视频| 91久久偷偷做嫩草影院电| 日韩毛片中文字幕| 精品在线观看一区| 亚洲激情精品| 国产免费一区视频观看免费 | 韩日一区二区| 欧美成人乱码一区二区三区| wwwwxxxx国产| 亚洲高清影视| 欧美做爰性生交视频| 91成品人影院| 91在线云播放| 免费观看中文字幕| 亚洲欧洲美洲av| 91精品国产综合久久久蜜臀粉嫩| 亚洲激情 欧美| 日韩欧美不卡| 欧美在线视频导航| 亚洲成人精品女人久久久| 久久精品亚洲精品国产欧美kt∨ | 国产三区二区一区久久| se在线电影| 亚洲成av人在线观看| 日本xxxx黄色| 日韩精品丝袜美腿| 久久综合电影一区| 一区二区视频在线免费观看| 99久久国产综合色|国产精品| 制服国产精品| 秋霞国产精品| 亚洲欧美一区二区三区久久| 久久免费精彩视频| 久草这里只有精品视频| 秋霞毛片久久久久久久久| 亚洲制服国产| 在线播放欧美女士性生活| 成人国产精品久久久网站| 99riav国产精品| 97久久精品午夜一区二区| 蜜芽在线免费观看| 在线观看不卡一区| 丰满少妇一区二区三区| 黄色日韩在线| 国产超碰91| 四虎影视国产在线视频| 欧美一二区视频| 制服丨自拍丨欧美丨动漫丨| 日本中文在线一区| 日本一区二区三区在线视频| 91jq激情在线观看| 亚洲国产成人精品女人久久久 | 在线看日韩精品电影| 少妇户外露出[11p]| 日韩天天综合| 国产日韩精品一区观看| 国产精品—色呦呦| 精品精品欲导航| 久久一区二区三| 风间由美性色一区二区三区 | 中文字幕黄色网址| 奇米777欧美一区二区| 涩涩涩999| 精品国产美女a久久9999| 中文字幕亚洲综合久久| 亚洲一区二区视频在线播放| 中文字幕日本不卡| 天天干天天操天天做| 一区二区三区在线电影| 亚洲最大福利视频网站| 久久香蕉一区| 亚洲国语精品自产拍在线观看| 日本少妇做爰全过程毛片| fc2成人免费人成在线观看播放| 国产无限制自拍| 欧美激情15p| 国产成人精品久久二区二区| 国产精品麻豆一区二区三区| 欧美视频一区二区三区四区| 国产尤物在线播放| 成人一区二区视频| 波多野结衣家庭教师在线| 精品国精品国产自在久国产应用| 国产精品成av人在线视午夜片| 色老头视频在线观看| 欧美一区二区视频免费观看| 日本少妇在线观看| 国产色综合久久| 天天av天天操| 一区二区三区福利| 五月婷婷综合色| 亚洲精品一区国产| 国语自产精品视频在线看一大j8 | 刘亦菲毛片一区二区三区| 亚洲成人精品影院| 特级西西www444人体聚色 | 91深夜福利视频| 黄色成人在线网| 亚洲人成绝费网站色www| 一本到在线视频| 午夜精品在线视频一区| 亚洲v国产v欧美v久久久久久| 久久66热偷产精品| 成人黄色av片| 久久精品国产99久久| 国产不卡一区二区三区在线观看| 欧美aa视频| 久久偷看各类女兵18女厕嘘嘘 | 在线播放亚洲激情| 亚洲高清视频网站| 欧美在线免费观看视频| 成人免费看片98| 国产色爱av资源综合区| 成人欧美精品一区二区| 男女性色大片免费观看一区二区| 久久久久久久久久久综合| 成人91在线| 国产一区二区三区奇米久涩 | 91精品午夜视频| 国产又粗又爽视频| 一区二区在线观看免费| 91视频免费在观看| 91视频观看免费| 免费高清视频在线观看| 日本大胆欧美人术艺术动态| 人妻少妇精品无码专区二区| 亚洲午夜精品一区 二区 三区| 蜜桃久久精品乱码一区二区| 日韩成人精品| 国产免费一区视频观看免费| 色老太综合网| 国产69久久精品成人| 亚洲丝袜一区| www.欧美精品| bbbbbbbbbbb在线视频| 精品视频久久久久久久| 欧美一级性视频| 日韩美女在线视频| 97国产成人无码精品久久久| 欧美性受极品xxxx喷水| 天堂а√在线中文在线新版 | 妺妺窝人体色www在线小说| 欧美国产先锋| 自拍另类欧美| 99国产精品一区二区| 亚洲欧美日韩精品久久久| 深爱激情综合| 欧美日韩视频在线一区二区观看视频| 91精品丝袜国产高跟在线| 91一区二区三区| 玖玖精品一区| 98国产高清一区| 精品国模一区二区三区欧美 | 欧美激情资源网| 精品成人av一区二区三区| 2021国产精品久久精品| 北岛玲一区二区| 91免费在线视频观看| 国产成人无码一区二区在线观看 | 中国毛片在线观看| 久久精品夜夜夜夜久久| 欧美人与性囗牲恔配| 久久综合九色综合欧美亚洲| 黄色在线观看av| 久久一夜天堂av一区二区三区| 添女人荫蒂视频| www国产成人| 蜜桃av乱码一区二区三区| 中文字幕免费不卡| 国产精品69久久久久孕妇欧美| 中文一区一区三区高中清不卡| 美国精品一区二区| 亚洲欧洲综合另类在线| 欧美三级黄色大片| 夜夜操天天操亚洲| 日韩美女一级片| 91成人免费在线视频| 亚洲视频久久久| 日韩欧美精品在线视频| 无码国产伦一区二区三区视频 | 欧美黄色激情视频| 中文字幕日韩精品一区| 深夜福利影院在线观看| 性做久久久久久免费观看| 亚洲天堂一区在线| 欧美三级视频在线| 国产偷拍一区二区| 亚洲国产精品系列| 第一福利在线| 不卡毛片在线看| 丝袜诱惑一区二区| 国产日韩欧美在线视频观看| 一区二区三区四区高清视频| 免费一区二区三区在在线视频| 欧美日韩亚洲在线观看| 少妇高潮大叫好爽喷水| 亚洲伊人观看| 99九九精品视频| av亚洲精华国产精华| 成年人视频软件| 亚洲午夜免费视频| 中文天堂在线视频| 精品国产一区二区三区不卡| 先锋av资源站| 欧美大尺度在线观看| 中文字幕 在线观看| 91精品中国老女人| 亚洲最好看的视频| 日韩一级片一区二区| 久久蜜桃精品| 国产大学生视频| 自拍偷拍国产精品| 日本丰满少妇做爰爽爽| 精品国精品国产| 乱人伦中文视频在线| 日本精品va在线观看| 白白在线精品| www亚洲国产| 日本在线不卡一区| 风间由美一二三区av片| 一区二区三区成人| 一卡二卡三卡在线| 在线视频日本亚洲性| 女厕盗摄一区二区三区| 超碰97国产在线| 午夜精品一区二区三区国产 | 中文字幕欧美日韩在线| 蜜桃视频www网站在线观看| 亚洲在线第一页| 久久日文中文字幕乱码| 成人在线观看a| 久久午夜色播影院免费高清| 亚洲精品国产精品乱码| 精品少妇一区二区三区视频免付费 | 欧美激情精品| 裸体大乳女做爰69| 久久精品国产一区二区| 亚洲成人黄色av| 色偷偷成人一区二区三区91| 无码精品视频一区二区三区| 欧美激情视频在线观看| 精品精品视频| 日本成人性视频| 另类小说视频一区二区| 在线国产视频一区| 精品国产乱码久久久久久天美| 亚洲第一色网站| 美女少妇精品视频| 高清一区二区中文字幕| 性欧美精品一区二区三区在线播放| 久久国产毛片| 美女久久久久久久久久| 中文字幕二三区不卡| 中文字幕1区2区3区| 亚洲另类激情图| 国产精品高清乱码在线观看 | 色婷婷中文字幕| 久久久亚洲天堂| 亚洲精品一区二区三区中文字幕 | 欧美日本精品一区二区三区| 青青视频在线观| 97精品欧美一区二区三区| 粉嫩一区二区三区四区公司1| 男人天堂av片| 成人三级伦理片| 国产精品suv一区二区三区| 亚洲成人精品av| 色呦呦久久久| 精品国产乱码久久久久久郑州公司| 国内一区二区三区| 欲求不满的岳中文字幕| 午夜精品视频一区| 韩国中文字幕2020精品| 日产精品99久久久久久| 欧美美女啪啪| 91淫黄看大片| 国产精品素人视频| 国产精品国产精品国产专区| 久久久成人的性感天堂| 成午夜精品一区二区三区软件| 妺妺窝人体色www看人体| 国产精品一区免费在线观看| 日本网站在线播放| 亚洲日本欧美日韩高观看| 综合久久伊人| 超碰超碰超碰超碰超碰| bt欧美亚洲午夜电影天堂| 亚洲国产av一区二区三区| 亚洲美女动态图120秒| 亚洲1234区| 一本一道久久a久久精品综合| 国产91在线|亚洲| 日本中文在线播放| 最近中文字幕日韩精品| 国产一区二区三区免费观看在线 | 亚洲综合欧美综合| 欧美人与z0zoxxxx视频| 51精品视频| 久久综合久久综合这里只有精品| 麻豆成人91精品二区三区| 国产这里有精品| 亚洲品质视频自拍网| 欧美aaaaaaaa| 91精品国产91久久久久麻豆 主演| 国产亚洲欧美日韩在线一区| 91资源在线视频| 日韩av免费在线| 91精品国产乱码久久久久久久|