90 歲程序員:他的壓縮算法改變了世界!

Jacob Ziv無(wú)損壓縮算法發(fā)展史
事實(shí)上,發(fā)明于 1838 年的 Morse code,是最早的數(shù)據(jù)壓縮實(shí)例。
隨著大型機(jī)的興起,數(shù)學(xué)家香農(nóng)和 Robert Fano(CSAIL 的計(jì)算先驅(qū)和創(chuàng)始人)發(fā)明了 Shannon-Fano(香農(nóng) - 范諾)編碼算法。他們的算法基于符號(hào) (symbol) 出現(xiàn)的概率來(lái)給符號(hào)分配編碼 (code)。一個(gè)符號(hào)出現(xiàn)的概率大小與對(duì)應(yīng)的編碼成反比,從而用更短的方式來(lái)表示符號(hào)。
1951 年,作為麻省理工的一名學(xué)生,David Huffman 選擇寫學(xué)期論文而非期末考試的方式來(lái)完成學(xué)業(yè)任務(wù),彼時(shí)他的論文題目是尋找二叉編碼的最優(yōu)算法。不過(guò),遺憾的是,經(jīng)過(guò)幾個(gè)月的努力后依然沒(méi)有任何成果,Huffman 決定放棄所有論文相關(guān)的工作,開(kāi)始學(xué)習(xí)為參加期末考試做準(zhǔn)備。就在那時(shí),Huffman 偶然間找到一個(gè)與 Shannon-Fano 編碼相類似但是更有效的編碼算法,這種編碼方式效率高、運(yùn)算速度快。
后來(lái)到了 20 世紀(jì) 70 年代,隨著在線存儲(chǔ)的出現(xiàn),哈夫曼編碼得到了廣泛應(yīng)用。不過(guò),經(jīng)過(guò)不斷地嘗試,不少科學(xué)家發(fā)現(xiàn)哈夫曼編碼所得的編碼長(zhǎng)度只是對(duì)信息熵(描述信源的不確定度)計(jì)算結(jié)果的一種近似,還無(wú)法真正逼近信息熵的極限。同時(shí),它需要兩次通過(guò)數(shù)據(jù)文件:一次計(jì)算文件的統(tǒng)計(jì)特征,第二次編碼數(shù)據(jù)。將字典與編碼數(shù)據(jù)一起存儲(chǔ),增加了壓縮文件的大小。

Ziv 的過(guò)往經(jīng)歷
1993 年,因精確科學(xué)而被授予以色列獎(jiǎng)(Israel Prize);
1995 年,因其 “對(duì)信息理論、數(shù)據(jù)壓縮的理論和實(shí)踐的貢獻(xiàn)” 獲得 IEEE 理查德?漢明獎(jiǎng)?wù)拢?/span>
1997 年,獲得 IEEE 信息論學(xué)會(huì)的克勞德?香農(nóng)獎(jiǎng);
2008 年,獲得 BBVA 基金會(huì)知識(shí)前沿獎(jiǎng)。
推薦閱讀:
