精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

淺談壓縮算法的那些事兒

開發 前端 算法
無論是做研究還是實際工作,都需要經過長期的積累,才能深刻理解存在的問題、解決方法、瓶頸所在、突破方向等等。

1. 開場白

好久不見,我是所長大白。

無論是做研究還是實際工作,都需要經過長期的積累,才能深刻理解存在的問題、解決方法、瓶頸所在、突破方向等等。

今天和大家聊一下壓縮算法相關的知識點,廢話不說,馬上開始閱讀之旅吧!

2.壓縮算法的理論基礎

任何適用于工程的算法都有它的數學和信息學理論基礎。

就如同我們寫論文要先做仿真,理論給實踐提供了一定的方向和依據。

對于壓縮算法來說,我們肯定會問:這是壓縮極限了嗎?還有提升空間嗎?

2.1 信息學之父

聊到這里,不得不提到信息學之父克勞德·艾爾伍德·香農,來簡單看下他的履歷簡介:

[[421668]]

克勞德·艾爾伍德·香農(Claude Elwood Shannon ,1916年4月30日—2001年2月24日)是美國數學家、信息論的創始人。

1936年獲得密歇根大學學士學位,1940年在麻省理工學院獲得碩士和博士學位,1941年進入貝爾實驗室工作,1956年他成為麻省理工學院客座教授,并于1958年成為終生教授,1978年成為名譽教授。

香農提出了信息熵的概念,為信息論和數字通信奠定了基礎,他也是一位著名的密碼破譯者。他在貝爾實驗室破譯團隊主要追蹤德國飛機和火箭。

相關論文:1938年的碩士論文《繼電器與開關電路的符號分析》,1948年的《通訊的數學原理》和1949年的《噪聲下的通信》,1949年的另外一篇重要論文《Communication Theory of Secrecy Systems》。

看完這段介紹,我感覺自己被秒成了粉末了,只能默默打開了網抑云,生而為人,我很遺憾。

2.3 信息熵entropy

熵本身是一個熱力學范疇的概念,描述了一種混亂程度和無序性。

這是個特別有用的概念,因為自然界的本質就是無序和混亂。

舉個不恰當的例子,我們經常看娛樂圈八卦新聞的時候,會說信息量很大,上熱搜了等等,那么我們該如何去度量信息量呢?

前面提到的信息學之父香農就解決了信息的度量問題,讓一種無序不確定的狀態有了數學語言的描述。

在1948年的論文《A Mathematical Theory of Communication》中作者將Entropy與Uncertainty等價使用的。

文中提出了信息熵是信息的不確定性(Uncertainty)的度量,不確定性越大,信息熵越大。

論文地址:http://people.math.harvard.edu/~ctm/home/text/others/shannon/entropy/entropy.pdf

在論文的第6章給出信息熵的幾個屬性以及信息熵和不確定性之間的聯系:

簡單翻譯一下:

  • 信息熵是隨著概率連續變化的;
  • 如果構成事件的各個因素的概率相等,那么信息熵隨構成因素總數n的增加而增加,即選擇越多,不確定性越大。
  • 當一個選擇可以分解為兩個連續選擇時,分解前后的熵值應該相等,不確定性相同。

我們假設一個事件有多種可能的選擇,每個選擇的概率分別記為p1,p2....pn,文章進一步給出了概率和信息熵的公式:

其中k為一個正常量。

經過前面的一些分析,我們基本上快懵圈了,太難了。

所以,我們暫且記住一個結論:信息是可度量的,并且和概率分布有直接聯系。

3. 數據壓縮的本質

既然有了理論的支持,那么我們來想一想 如何進行數據壓縮呢?

數據壓縮可以分為:無損壓縮和有損壓縮。

無損壓縮 適用于必須完整還原原始信息的場合,例如文本、可執行文件、源代碼等。

有損壓縮,壓縮比很高但無法完整還原原始信息,主要應用于視頻、音頻等數據的壓縮。

3.1 數據壓縮的定義

壓縮的前提是冗余的存在,消除冗余就是壓縮,用更少的信息來完整表達信息,來看下百科的定義:

數據壓縮是指在不丟失有用信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率,

需要按照一定的算法對數據進行重新組織,減少數據的冗余和存儲的空間的一種技術方法。

舉幾個簡單的例子:

  • "北京交通大學的交通信息工程及控制專業不錯" 和 "北交的交控專業不錯"

在上述文本中"北京交通大學"可以用"北交"代替,"交通信息工程及控制專業"可以用"交控專業"代替。

  • "aaaaaaaaxxxxxxkkkkkkzzzzzzzzzz" 和 "8a6x6k10z"

在上述文本中有比較明顯的局部重復,比如a出現了8次,z出現了10次,如果我們在分析了輸入字符的分布規律之后,確定了"重復次數+字符"的規則,就可以進行替換了。

3.2 概率分布和數據編碼

本質上來說,數據壓縮就是找到待壓縮內容的概率分布,再按照一定的編碼算法,將那些出現概率高的部分代替成更短的形式。

所以輸入內容重復的部分越多,就可以壓縮地越小,壓縮率越高,如果內容幾乎沒有重復完全隨機,就很難壓縮。

這個和我們平時優化代碼性能的思路非常相似,熱點代碼的優化才能帶來更大的收益。

3.3 數據壓縮極限

前面提到了,用較短的字符串來替換較長的字符串就實現了壓縮,那么如果對每次替換都使用最短的字符串,應該就可以認為是最優壓縮了。

所以我們需要找到理論上的最短替換串的長度,換到二進制來說就是二進制的長度,這樣就可以接近壓縮極限了。

我們來分析一下:

  • 拋硬幣 只有正面和反面 兩種情況 因此使用1位二進制 0和1 就可以
  • 籃球比賽 存在勝/負/平 三種情況 因此需要使用2位二進制 00勝 01負 10平
  • 猜生日月份 存在1-12月 12種情況 因此需要使用4位二進制 來表示各個月份
  • 如果可能性有n個不同的值,那么替換串就需要log2(n)個二進制位來表示

假定內容由n個部分組成,每個部分出現概率分別為p1、p2、...pn,那么替代符號占據的二進制最少為:

  1. log2(1/p1) + log2(1/p2) + ... + log2(1/pn) = ∑ log2(1/pn) 

可能的情況越多,需要的二進制長度可能就越長,對于n相等的兩個文件,概率p決定了這個式子的大?。?/p>

  • p越大,表明文件內容越有規律,壓縮后的體積就越小;
  • p越小,表明文件內容越隨機,壓縮后的體積就越大。

舉例:有一個文件包含A, B, C個三種不同的字符,50%是A,30%是B,20%是C,文件總共包含1024個字符,每個字符所占用的二進制位的數學期望為:

  1. 0.5*log2(1/0.5) + 0.3*log2(1/0.3) + 0.2*log2(1/0.2)=1.49 

求得壓縮后每個字符平均占用1.49個二進制位,理論上最少需要1.49*1024=1526個二進制位,約0.1863KB,最終的壓縮比接近于18.63%。

4. 霍夫曼編碼簡介

哈夫曼編碼(Huffman Coding),又稱霍夫曼編碼,是一種編碼方式,哈夫曼編碼是可變字長編碼(VLC)的一種。Huffman于1952年提出一種編碼方法,該方法完全依據字符出現概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,一般就叫做Huffman編碼(有時也稱為霍夫曼編碼)。

霍夫曼編碼使用變長編碼表對源符號進行編碼,其中變長編碼表是通過評估源符號出現的幾率得到的。

出現幾率高的字母使用較短的編碼,出現幾率低的字母使用較長的編碼,這使得編碼之后字符串的總長度降低。

4.1 前綴編碼

霍夫曼編碼除了使用變長碼之外,還使用前綴編碼來確保解碼時的唯一性,舉個例子:

A-0 C-1 B-00 D-01 則編碼后為:000011010

當我們對它進行解碼的時候,會發現 0000 可能對應多種解碼方式,如 AAAA、AAB、ABA、BB。

霍夫曼樹中葉子節點之間不存在父子關系,所以每個葉子節點的編碼就不可能是其它葉子節點編碼的前綴,這是非常重要的。

4.2 霍夫曼樹簡單構造

霍夫曼樹是霍夫曼編碼的重要組成部分,我們拿一個具體的例子來看下霍夫曼樹的一點特性。

  • 輸入數據:"boob is bee boy"
  • 字符串集合和頻次統計
    • 集合 {b,o,s,i,e,y}
    • 頻次 {b:4,o:3,e:2,i:1,y:1,s:1}
  • 總計有6個字符,因此需要3位二進制
  • 按照頻率越高字符越短&前綴編碼規則進行處理
    • b:00
    • o:01
    • e:100
    • i:101
    • y:110
    • s:111
    • 注意:e并不是001,因為這樣不符合前綴編碼 b是e的父節點

霍夫曼編碼的原理和實現還是比較復雜的,篇幅有限,后面單獨寫一篇文章詳細介紹。

5. 本文小結

本文對數據壓縮進行了簡要的介紹,說明了數據壓縮的本質和算法的基本原理,以及霍夫曼樹的一些原理。

數據壓縮和分析內容的概率分布以及編碼有直接的關系,但是各個場景下輸入內容的側重點會有所不同,利用機器學習來處理數據壓縮也是當前的一個熱門話題。

篇幅有限,后續會重點展開一些細節,這篇就算拋磚引玉開頭篇了。

 

我們下期見。

 

責任編輯:武曉燕 來源: 后端研究所
相關推薦

2023-04-11 07:34:40

分布式系統算法

2022-05-13 14:36:12

網絡犯罪網絡攻擊密碼

2020-04-08 09:20:25

Linux內存系統

2013-06-13 11:29:14

分布式分布式緩存

2009-07-14 11:51:00

XML壓縮

2013-04-23 10:51:15

Linux壓縮

2021-03-18 09:01:53

軟件開發軟件選型

2021-06-09 13:28:40

密碼安全身份認證數據安全

2013-12-26 14:23:03

定位系統GPS監測

2011-02-25 14:35:00

2022-02-08 17:39:04

MySQL服務器存儲

2018-09-26 06:50:19

2021-06-02 08:33:31

TPCTPC-H系統

2019-03-12 10:46:17

TCP協議算法

2021-03-09 23:12:51

Python集合項目

2021-02-01 14:17:53

裝飾器外層函數里層函數

2021-10-13 08:53:53

Zookeeper存儲系統

2016-06-07 10:47:42

2010-10-15 10:31:00

2022-04-14 11:50:39

函數組件hook
點贊
收藏

51CTO技術棧公眾號

97超碰蝌蚪网人人做人人爽| 亚洲国产天堂久久国产91 | 无码人妻丰满熟妇区96| 午夜视频福利在线| 免费在线观看视频一区| 美女啪啪无遮挡免费久久网站| 国产在线观看免费播放| 在线观看欧美日韩电影| 一区在线观看免费| 精品久久蜜桃| 国产精品无码在线播放| 国产欧美激情| 不卡av电影院| 亚洲成人网在线播放| 9999精品免费视频| 亚洲性色视频| 精品呦交小u女在线| 欧美日韩精品区别| 国产理论在线| 国产精品久久久久久妇女6080| 国产精品免费区二区三区观看 | 在线不卡a资源高清| 九九爱精品视频| 久操视频在线观看| 久久精品一区二区三区不卡 | 男人天堂亚洲| 欧美极品少妇xxxxⅹ高跟鞋| 国产伦精品一区二区三| 国产乱人乱偷精品视频a人人澡| 国产一区二区精品| 九九久久综合网站| 亚洲色图100p| 国产精品三级| 日韩av在线免费看| 精品国产一二区| 青草综合视频| 欧美亚洲国产一区二区三区va| 成人黄色av片| 精灵使的剑舞无删减版在线观看| 成人欧美一区二区三区1314| 日本视频一区在线观看| 香蕉久久国产av一区二区| 国产成人aaa| 91精品视频观看| 国产精品成人久久久| 免费日韩一区二区| 日本高清不卡在线| 久久亚洲天堂网| 亚洲国产日本| 欧美第一黄网免费网站| 久久无码专区国产精品s| 欧美性aaa| 欧美日韩国产片| 亚州精品一二三区| 欧美视频免费看| 欧美日韩精品欧美日韩精品一综合| 97视频在线免费播放| 伊人久久精品一区二区三区| 精品国产福利在线| 久久精品免费一区二区| 高清视频在线观看三级| 激情成人中文字幕| 男人日女人下面视频| av手机在线观看| 亚洲成av人影院| 97超碰青青草| 欧美电影免费看| 在线观看日韩精品| 免费一区二区三区在线观看| 欧美在线一级| 日韩一区二区三区在线| 能看毛片的网站| 精品一区二区三区中文字幕| 日韩美女视频在线| 欧美一级片黄色| 三上悠亚激情av一区二区三区 | 伊人久久国产精品| 国产米奇在线777精品观看| 亚洲自拍小视频免费观看| 国产一级特黄aaa大片| 精品动漫3d一区二区三区免费| 久久全国免费视频| 日韩 国产 欧美| 精品在线视频一区| 国产精品久久亚洲7777| 色吊丝在线永久观看最新版本| 国产女同互慰高潮91漫画| 亚洲啪啪av| 怡红院av在线| 国产精品女人毛片| 糖心vlog在线免费观看| 国产在线一二| 亚洲视频一二区| 国产白丝袜美女久久久久| 国产激情欧美| 精品国产一区二区三区久久久蜜月 | 欧美成人xxxx| 欧美精品一区二区久久婷婷| 四虎国产精品成人免费入口| 久久久9色精品国产一区二区三区| 欧美极品在线视频| 奴色虐av一区二区三区| 国产成人精品免费看| 日韩精彩视频| 天天色天天射天天综合网| 色综合久久久久综合体桃花网| 91网站在线观看免费| 亚洲优女在线| 日韩一区二区免费在线观看| 国产精品三级在线观看无码| 影音先锋日韩在线| 热99精品里视频精品| 国产高潮流白浆喷水视频| 久久久久综合网| www.在线观看av| 韩国理伦片久久电影网| 亚洲精品国产精品久久清纯直播 | 亚洲国产你懂的| 牛夜精品久久久久久久| 美女主播精品视频一二三四| 久久香蕉国产线看观看av| 亚洲AV无码成人精品区东京热| 红桃视频国产一区| 国产精品视频99| 天堂a√在线| 99re在线精品| 公共露出暴露狂另类av| 国产一区二区三区朝在线观看| 精品国产乱码久久久久久影片| 网爆门在线观看| 丝袜国产日韩另类美女| 久久99精品久久久久久久久久 | 91国语精品自产拍在线观看性色| 91欧美日韩麻豆精品| 国产日产精品1区| www国产精品内射老熟女| 2020最新国产精品| 美女久久久久久久久久久| 69视频免费看| 久久综合色天天久久综合图片| 国产av熟女一区二区三区| 国产高清日韩| 久久精品国产99国产精品澳门| 男人的天堂av网站| 久久婷婷国产综合国色天香| 无罩大乳的熟妇正在播放| 午夜视频在线观看精品中文| 久久影视电视剧免费网站| 久久这里只有精品9| 国产婷婷一区二区| 国产a视频免费观看| 日韩影视在线观看| 6080yy精品一区二区三区| 亚洲成人中文字幕在线| 懂色av一区二区三区免费看| www.黄色网址.com| 精品国产一级| 欧美黑人巨大精品一区二区| 精品人妻aV中文字幕乱码色欲 | 亚洲电影中文字幕| 国产在线拍揄自揄拍| 一本色道久久综合亚洲精品不卡| 日产日韩在线亚洲欧美| 欧美xxx.com| 色婷婷久久久综合中文字幕 | 国产xxxxx视频| 蜜桃精品wwwmitaows| 日本久久亚洲电影| 成人高清网站| 欧美情侣在线播放| 中文字幕在线2021| 在线欧美三区| 精品综合久久| 91精品影视| 欧美成人精品福利| 五月天综合在线| 91在线视频在线| 无遮挡又爽又刺激的视频| 欧美限制电影| 91精品在线看| 黄色在线免费观看网站| 亚洲人成在线免费观看| 夜夜骚av一区二区三区| 99久久精品国产导航| 免费无码不卡视频在线观看| 国产乱码精品一区二区三区四区 | 亚洲视频一起| 欧美在线激情视频| 国产中文字幕在线看| 91精品国产乱码久久蜜臀| 国产一级一级片| 久久精品亚洲一区二区三区浴池| 色天使在线观看| 激情欧美国产欧美| 亚洲精品二区| 国产精品网站在线看| 国产极品jizzhd欧美| 国产1区在线| 精品视频久久久久久| 一本色道久久综合亚洲| 亚洲成人自拍一区| 久久久久久国产免费a片| 国产精品一区二区三区四区| 天堂精品一区二区三区| 北条麻妃在线一区二区免费播放| 国产91色在线播放| 羞羞污视频在线观看| 亚洲美女www午夜| 99热这里只有精品5| 欧洲一区二区av| 久久精品视频国产| 中文字幕乱码亚洲精品一区| 亚洲图片欧美另类| 美女视频免费一区| 国产黄色一级网站| 你懂的网址国产 欧美| 成人av在线网址| 免费h视频在线观看| 久久久精品久久久| 国产精品一区在线看| 欧美成人免费网站| 97超碰人人草| 色综合婷婷久久| 免费一级片在线观看| 日韩一区欧美小说| 亚洲国产日韩一区无码精品久久久| 成人一区二区三区| 亚洲高清视频免费| 免费成人av在线| 少妇性l交大片| 欧美日韩久久| 国产对白在线播放| 久久国产小视频| 亚洲成人蜜桃| 蜜桃a∨噜噜一区二区三区| 国产精品亚洲一区| 91大神精品| 国产精品一区二区三区在线播放 | 你懂的在线观看网站| 国产酒店精品激情| 天堂中文av在线| 精品一区二区在线观看| 欧美亚洲日本国产| 亚洲精品在线观| 在线免费观看中文字幕| 色综合久久综合网97色综合 | 国产欧美欧洲在线观看| 性欧美hd调教| 日韩av免费网站| 高清电影一区| 国产精品久久久久久久美男| 久久91导航| 日韩免费视频在线观看| 亚洲一区二区三区四区| 国产精品999| 国产超碰精品| 国产精品免费视频xxxx| 青娱乐极品盛宴一区二区| 国产欧美日韩视频| 日本久久二区| 亚洲伊人久久大香线蕉av| 精品一区二区三区中文字幕| 亚洲自拍小视频| 国产 日韩 欧美 综合 一区| 国产综合欧美在线看| 老司机成人在线| 欧美极品视频一区二区三区| 国产精品中文字幕亚洲欧美| 少妇特黄a一区二区三区| 四虎成人av| 国产成人三级视频| 狠狠色丁香久久综合频道| 国产一区二区在线视频播放| 香蕉久久久久久久av网站| av免费在线播放网站| 久久国产综合精品| 精产国品一区二区三区| 高潮精品一区videoshd| 免费a级黄色片| 国产精品伦一区| 在线免费日韩av| 亚洲va国产天堂va久久en| 中文字幕免费在线观看视频| 欧美三日本三级三级在线播放| 国产高清视频免费观看| 亚洲韩国日本中文字幕| 国产日本在线视频| 久久综合久久美利坚合众国| 激情国产在线| 国产精品视频免费观看www| 欧美.com| 蜜桃麻豆91| 91成人国产| 各处沟厕大尺度偷拍女厕嘘嘘| 美女视频网站黄色亚洲| 国产69视频在线观看| 日本一区免费视频| 久久久国产精华液| 91黄视频在线观看| 亚洲av无码一区二区乱子伦| 精品爽片免费看久久| 成人免费观看视频大全| 91av在线看| av在线精品| 日本一区视频在线观看| 欧美视频久久| 亚洲黄色av网址| 不卡电影免费在线播放一区| 又色又爽的视频| 天天综合色天天综合| 国产欧美一级片| 亚洲综合图片区| 中文字幕欧美色图| 亚洲成人1234| 超碰在线观看免费| 国产精品扒开腿爽爽爽视频| 9999久久久久| 成人免费看片视频在线观看| 日本色综合中文字幕| 天天天干夜夜夜操| 日本中文在线一区| 欧美大喷水吹潮合集在线观看| 国产精品美女久久久久久 | 在线视频婷婷| 欧美在线视频播放| 澳门精品久久国产| 亚洲五码在线观看视频| 蜜桃一区二区三区四区| 成人无码www在线看免费| 成人午夜av在线| 四虎884aa成人精品| 日本久久一区二区| 天堂а√在线8种子蜜桃视频| 欧美激情在线有限公司| 国产精品一区免费在线| 日韩欧美一区二区视频在线播放| 亚洲高清资源| 又大又长粗又爽又黄少妇视频| 成人免费一区二区三区视频| 性高潮视频在线观看| 亚洲最新在线视频| 另类专区亚洲| 欧美日韩国产免费一区二区三区| 亚洲一级二级| 国产草草浮力影院| 午夜激情久久久| 色屁屁草草影院ccyycom| 欧美激情精品久久久久久大尺度| 136福利精品导航| 91午夜在线观看| 东方aⅴ免费观看久久av| 国产一级特黄aaa大片| 亚洲福利视频网站| 国产精品25p| 美女黄毛**国产精品啪啪| 一区二区日韩免费看| 88av在线播放| 福利视频一区二区| 嫩草研究院在线| 国产精品视频网址| 欧美国产美女| 99国产精品免费视频| 亚洲国产一区二区三区| 欧美一级在线免费观看| 91精品国产精品| 欧美欧美黄在线二区| 杨幂毛片午夜性生毛片| 国产精品久久久久久久久免费桃花| 在线免费看av片| 免费91在线视频| 精品国产乱子伦一区二区| 免费黄色日本网站| 国产精品视频一区二区三区不卡| 依依成人在线视频| 久久天天躁狠狠躁夜夜爽蜜月| 97人人澡人人爽91综合色| koreanbj精品视频一区| 中文一区在线播放| 国产日韩欧美一区二区东京热| 久久69精品久久久久久国产越南| 免费看久久久| 国产精品天天av精麻传媒| ...xxx性欧美| 天天操天天干天天| 国产精品久久不能| 中文字幕日韩一区二区不卡| 天天躁日日躁狠狠躁av麻豆男男| 色一情一乱一乱一91av| 黄色精品免费看| 久久久99爱| 麻豆一区二区三区| 日本a在线观看| 色综合亚洲精品激情狠狠| 视频在线观看免费影院欧美meiju| 鲁一鲁一鲁一鲁一澡| 国产精品萝li| 亚洲区小说区图片区| 国产日韩在线视频| 国产偷自视频区视频一区二区| 美国美女黄色片|