音視頻已強勢崛起,我們該如何快速入門音視頻技術?
共 3362字,需瀏覽 7分鐘
·
2022-02-09 17:34
作者: 李超
曾在 跟誰學 負責直播平臺技術的管理工作;在 新東方集團 任職音視頻技術專家;
在音視頻會議行業(yè)工作 6年,在線教育行業(yè)工作 4年,一直聚焦在多人互動實時通訊領域。
最近經(jīng)常遇到一些同學問我如何學習音視頻,怎樣才能快速上手?還有一些對音視頻不了解的同學問我該不該學習音視頻?作為一名音視頻行業(yè)的10年老兵,我有一些思考分享給大家,希望能對你有所幫助。
大背景
2020年真的是一個多災、多難的年份,冠狀病毒的爆發(fā)使得本該舉國歡慶的春節(jié)變得尤為沉悶。不能走親,不能訪友,除了呆在家里,那兒也不能去。正如張文宏大夫向我們勸解的,我們要將病毒給悶死。
大家都盼著疫情可以趕緊過去,早點恢復正常的生活。但從目前的情況看,短時間內這個疫情是很難結束的。這不剛從中國消停了一陣,又跑到海外大爆發(fā)了,誰知道它會不會又轉回來呢?
可我們還得生活!還得工作!還要學習!
好時代
幸運的是我們生活在一個好時代,科技在這幾十年得到了迅猛的發(fā)展。在疫情肆虐的當下,我們可以通過音視頻會議進行遠程辦公;我們還有在線教育系統(tǒng),對于大多數(shù)學生來說,完全可以在家進行在線學習。
從某個角度看,這次疫情雖然導致很多行業(yè)處于崩潰邊緣,但也催生了新的行業(yè)發(fā)展,其中音視頻會議和在線教育就是因疫而起的行業(yè)。在疫情短時間內難以結束的情況下,音視頻會議和在線教育的重要性馬上體現(xiàn)了出來,新的溝通方式和教育方式被越來越多的人所認知,所接納。
甚至我們可以判定,在線教育行業(yè)和音視頻會議行業(yè)會在今年崛起,并在未來十年得到迅猛發(fā)展。
目前,各大巨頭公司(如阿里、騰訊、今日頭條,新東方等),紛紛在這兩個方向上謀篇布局,進行了大量的投資,籠絡技術人才,也可以間接佐證這個判斷了。
大趨勢
從未來的大趨勢來看,隨著5G時代的到來,音視頻慢慢變成人們日常生活中的必須品。除了在線教育、音視頻會議、即時通訊這些必須使用音視頻技術的產(chǎn)品外,其它的產(chǎn)品也需要加入音頻、視頻元素。比如說將現(xiàn)在的網(wǎng)站注冊與登陸的圖文方式全部改為語音方式是否更加安全?相信隨著音視頻技術的普及,更加有創(chuàng)意的產(chǎn)品會如雨后春筍般孕育而生。
目前,音視頻技術從之前的“象牙塔”逐漸走向“百姓家”已是不爭的事實。正是因為這樣一個大的趨勢,現(xiàn)在除了各大廠之外,其它一些小廠也開始尋找音視頻人才。一名稍好點的音視頻人才現(xiàn)在可能會有3-4家公司搶著要、掙著要。
對音視頻人才的需求從小眾變成了大眾,這更多的是大家對未來市場預期的結果。做個不恰當?shù)谋扔鳎?G/4G的出現(xiàn),促成了移動互聯(lián)網(wǎng)10年繁榮。而5G的出現(xiàn),也會促成至少10年音視頻行業(yè)的繁榮。
除了5G的到來可以讓音視頻得到更廣范的應用外,音視頻技術在未來還有更重要的作用。事實上,在人類可以識別人信息中,音視頻包含的信息是最豐富的,但人類并沒有很好的將它們利用起來。
究其原因,是因為這些信息都是非結構化的數(shù)據(jù),而人類善長的是處理結構化數(shù)據(jù)(比如數(shù)據(jù)庫)。而對于這些非結構化的數(shù)據(jù)卻無從下手的,所以這些音視頻數(shù)據(jù)都被白白浪費掉了。
但隨著計算機視覺、人工智能的發(fā)展,人們開始撐握了如何將音視頻這類非結構化數(shù)據(jù)轉化為結構化數(shù)據(jù)的方法。一旦我們將音視頻數(shù)據(jù)轉為結構化數(shù)據(jù)后,我們就可以利用現(xiàn)有的技術(如搜索引擎、大數(shù)據(jù),數(shù)據(jù)挖掘等)對這些數(shù)據(jù)進行各種分析了,這個價值是不是更加驚人呢?而這一切的基礎都是音視頻技術。
所以,音視頻研發(fā)的未來是極為廣闊的。目前可以說是學習音視頻的最佳時機,及早的加入音視頻研發(fā)的隊伍,才能使自己在未來的職場上更有作為。
有錢景
正如我上面所說的,各大廠為了爭奪未來,搶占先機,不惜重金籠絡人才。通過招聘市場我們可以了解到,一名合格的音視頻開發(fā)人員,少則年薪 30 萬起,多則可以達 100萬以上。
出現(xiàn)這種情況的原因主要有兩個,一是音視頻方面的人才不好培養(yǎng),二是現(xiàn)有的優(yōu)秀人才太少了。
從技術上來說,音視頻從業(yè)者分成兩個方向,一是搞算法的,另一個是搞工程的。搞音視頻算法的這類人非常少,需要有深的數(shù)學能力和算法背景。相對來說,學習成本高,一般企業(yè)不需要,也養(yǎng)不起。這類人一般都會選擇去大公司,薪水百萬都是Low的。這些人一般只專注在一個領域上,因此就業(yè)面也窄。
搞工程的人相對多一些,他們有扎實的理論基礎,很強的技術功底,對音頻/視頻都非常熟悉。這類人才工資要比同級別的其它開發(fā)人員薪資高20%以上。
因此,搞音視頻技術的開發(fā)人員錢景還是非常樂觀的。而且隨著時間的推移,在未來幾年音視頻人才會更加炙手可熱。
音視頻好學嗎?
說句實話,音視頻自學起來困難重重,學習成本非常高,且效率低。主要有兩方面的原因,一是音視頻知識龐雜,通俗易懂的資料非常少;另一方面,網(wǎng)上充斥著大量的錯誤信息,使得很多初學者掉到坑里就爬不出來了。
我來舉個例子,按照傳統(tǒng)的音視頻學習方法,學習音視頻你首先要閱讀大量的音視頻規(guī)范/協(xié)議文檔(如H264、MP4/FLV、RTP/RTCP等)。這些文檔中的內容基本都以位為單位的,即每個二進制位的變化都代表不同的含義,這種文檔極其枯燥,很難閱讀。
在對文檔熟悉的前提下,再進行代碼的開發(fā)難度就“更上一層樓”了。這時你會發(fā)現(xiàn),如果你對 C/C++ 使用不熟練,沒有專門進行過訓練的話,你就進入了煉獄般的狀況,那是一種折磨。
好在現(xiàn)在有FFMPG、WebRTC 等開源庫,大大降低了研發(fā)成本。但即使這樣,對于小白同學來說學習音視頻依然是十分困難的。
小白如何學習音視頻?
如上面所講,音視頻的入門難度還是蠻大的,我們該如何更快的入門呢?
我覺得最好的方式有非常好的課程,可以循序漸近,有條理、系統(tǒng)的學習。當然能有老師指導,遇到問題時老師能及時給予解答就更加錦上添花了。這樣既可以快速入門,又可以系統(tǒng)的學習音視頻知識,可以說這是最佳途徑了。
對于能力強的同學也可以自學,但相對來說,這個時間成本就太高了。遇到一個坑卡幾天是很正常的。網(wǎng)上音視頻資料那么多坑,你想想要經(jīng)歷多長時間你才能真正學會它呢?即使你歷盡千辛入門之后,你會發(fā)現(xiàn)離用人單位的要求還差著十萬八千里呢。
對于各大廠來說,他們要招聘的人才既要有非常扎實的基礎知識,又需要有一定的工程經(jīng)驗;如果你在學習的過程中沒有實際做一些項目就很難達到它們的要求。
正是基于這樣的考慮,我推出了一系列音視頻的課程。這些課程中既有適合小白同學入門的課程(如音視頻小白系統(tǒng)入門), 又有進階的課程(如FFmpeg音視頻核心技術精講與實戰(zhàn))。
其中與ffmpeg相關的課程是音視頻小白系統(tǒng)入門和FFmpeg音視頻核心技術精講與實戰(zhàn)。與 WebRTC 相關的課程是 WebRTC實時互動直播技術入門與實戰(zhàn)和WebRTC流媒體服務器設計與開發(fā)。
如果你想學習音視頻基礎知識,音視頻處理、編輯、特效相關的內容就學習ffmpeg的系列課程。如果你想學習音視頻實時通訊(如音視頻會議、在線教育)就學習WebRTC相關的課程。
入門音視頻要學習哪些內容呢?
這里我簡單列舉一下入門音視頻都要學哪些知識。對于已經(jīng)學習了一些音視頻知識而不知道自己目前水平的同學也可以作為一個參考,看看自己是否達到了入門水平。
- ffmpeg在不同系統(tǒng)中的安裝與簡單裁剪
- 音頻基礎知識,如頻率、采樣大小和通道數(shù)等
- 音頻的壓縮原理
- 如何從不同的設備上采集音頻數(shù)據(jù)
- 如何對音頻進行不同的編解碼
- 視頻的基礎知識
- H264編碼原理
- 如何從不同設備上采集視頻數(shù)據(jù)
- 熟悉YUV的一些常見格式(YUV420、NV21,YV12的不同)
- 如何將YUV數(shù)據(jù)編碼為H264/H265、VP8/VP9等
- FLV/RTMP/HLS/MP4協(xié)議要十分清楚
......
從上面的列表中你可能看到,要入門音視頻要學的知識還是不少的。尤其是音視頻的基礎原理是最為重要的,否則你去面試人家問你為什么會產(chǎn)生花屏,為什么會產(chǎn)生卡頓,如何才能秒開這些簡單的問題你都無法回答上來。
小結
總之,音視頻已經(jīng)強勢崛起,相信未來的十年一定是音視頻的十年。并且將音視頻技術與計算機視覺和人工智能結合將引領未來二十年。
現(xiàn)在正是學習音視技術的最佳時機,大家一定要把握住機會,跟上時代的步伐,讓自己可以在未來大有作為。
