音頻基礎(chǔ)知識(shí)

PS:由淺入深,慢就是快。
本篇總結(jié)下音頻基礎(chǔ)知識(shí),音視頻相關(guān)文章如下:
下面將從以下幾個(gè)方面進(jìn)行介紹:
聲音的產(chǎn)生
聲音的三要素
模數(shù)轉(zhuǎn)換
原始音頻數(shù)據(jù)
PCM與Wav
音頻處理流程
聲音的產(chǎn)生
聲音是由物體振動(dòng)產(chǎn)生的,通過(guò)空氣、固體、液體等介質(zhì)進(jìn)行傳輸?shù)囊环N聲波,可以被人耳識(shí)別的聲波的范圍是 20Hz~20000Hz 之間,也叫做可聽(tīng)聲波,這種聲波稱(chēng)之為聲音,根據(jù)聲波頻率的不同可以主要分為:
可聽(tīng)聲波:20Hz~20kHz
超聲波:> 20kHz
次聲波:< 20Hz
此外,人的發(fā)聲范圍一般是 85Hz~1100Hz。
聲音的三要素
聲音的三要素分別是音調(diào)、音量、音色,具體如下:
音調(diào):指的是聲音頻率的高低,表示人的聽(tīng)覺(jué)分辨一個(gè)聲音的調(diào)子高低的程度,物體振動(dòng)的快,發(fā)出的聲音的音調(diào)就高,振動(dòng)的慢,發(fā)出的音調(diào)就低。
音量:又稱(chēng)音強(qiáng)、響度,指聲音的振幅大小,表示人耳對(duì)所聽(tīng)到的聲音大小強(qiáng)弱的主觀感受。
音色:又稱(chēng)音品,指不同聲音表現(xiàn)在波形方面總是有與眾不同的特性,不同的物體振動(dòng)都有不同的特點(diǎn),反映每個(gè)物體發(fā)出的聲音的特有的品質(zhì),音色具體由諧波決定,好聽(tīng)的聲音絕不僅僅是一個(gè)正弦波,而是諧波。
模數(shù)轉(zhuǎn)換

采樣:連續(xù)信號(hào)轉(zhuǎn)換為離散信號(hào)的過(guò)程,每個(gè)一定時(shí)間的信號(hào)值來(lái) 替代原來(lái)時(shí)間段連續(xù)的信號(hào)值,這個(gè) 1s 內(nèi)的采樣次數(shù)就是采樣率
,如 8KHz 是電話(huà)信號(hào)的采樣率,可以滿(mǎn)足通話(huà)需要,音頻 CD
一般是 44.1kHz,數(shù)字電視一般是是 48kHz,采樣率越高聲音的還
原程度越高。
量化:將采樣后 的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的過(guò)程,量化分為均
勻量化和非均勻量化,上圖中顯然使用了均勻量化,量化級(jí)數(shù)是 8。
編碼:將量化后的信號(hào)轉(zhuǎn)換為對(duì)應(yīng)的二進(jìn)制代碼,最簡(jiǎn)單就是自然
二進(jìn)制碼,其他編碼方式感興趣自行去了解,上圖中編碼指的是信
源編碼,除此之外還有信道編碼。
原始音頻數(shù)據(jù)
Sample Size:采樣大小,也是量化級(jí)數(shù),表示一個(gè)采樣用多少位 bit 存放,常用的是 16 位。
Sample Rate:采樣率,表示每次采樣的次數(shù),單位 Hz,常見(jiàn)的采樣率有 8k、16k、32k、44.1k、48k 等。
Number of Channels:聲道數(shù),表示當(dāng)前 PCM 數(shù)據(jù)中包含的聲道數(shù),如單聲道、雙聲道、多聲道等。
Byte Ordering:字節(jié)序,表示 PCM 數(shù)據(jù)存儲(chǔ)的字節(jié)序是大端存儲(chǔ)(big-endian)還是小端存儲(chǔ)(little-endian),為了數(shù)據(jù)處理效率的高效,通常為小端存儲(chǔ)。
Sign:表示當(dāng)前 PCM 數(shù)據(jù)是否有符號(hào)位
Integer Or Floating Point:表示當(dāng)前 PCM 數(shù)據(jù)使用整型還是浮點(diǎn)型來(lái)表示。
1采樣率 * 采樣大小 * 聲道數(shù)

PCM與WAV
PCM:一種編碼方式,在音視頻領(lǐng)域則理解為原始音頻數(shù)據(jù)裸流;
WAV:一種音頻文件格式,可存儲(chǔ) PCM 數(shù)據(jù),相當(dāng)于在 PCM 基礎(chǔ)上添加了 WAV 頭部。

音頻處理流程
AudioRecord 、MediaRecord 等采集到的音頻數(shù)據(jù)就是 PCM 數(shù)據(jù),這種數(shù)據(jù)屬于數(shù)字音頻信號(hào),是原始的 PCM 裸流,PCM 數(shù)據(jù)經(jīng)過(guò)編碼也就是將 PCM 數(shù)據(jù)壓縮,在通過(guò)復(fù)用生成對(duì)應(yīng)的音頻文件,二是音頻文件的播放,經(jīng)解復(fù)用、解碼轉(zhuǎn)換成 PCM 進(jìn)行播放。
技術(shù)交流,歡迎加我微信:ezglumes ,拉你入技術(shù)交流群。
推薦閱讀:
開(kāi)通專(zhuān)輯 | 細(xì)數(shù)那些年寫(xiě)過(guò)的技術(shù)文章專(zhuān)輯
NDK 學(xué)習(xí)進(jìn)階免費(fèi)視頻來(lái)了
推薦幾個(gè)堪稱(chēng)教科書(shū)級(jí)別的 Android 音視頻入門(mén)項(xiàng)目
覺(jué)得不錯(cuò),點(diǎn)個(gè)在看唄~

