視頻清晰度優(yōu)化指南 | 得物技術
一、背景介紹
二、評價標準
2.1 客觀標準
完全參考:兩個視頻逐幀對比分析,計算對比的質量,這種使用的比較多,常見的VMAF、PSNR、SSIM都是完全參考。
部分參考:截圖視頻中的部分幀來對比分析。有些場景例如直播沒法完全對比,截取部分幀來對比是比較科學的。
VMAF 全稱 Video Multi-method Assessment Fusion ,它借助人類視覺模型以及機器學習來評估一個視頻的質量。
VMAF的評價指標主要包含:其中VIF和DLM是空間域的,表示一幀畫面之內的特征;TI是時間域的,表示多幀畫面之間的相關性特征。
視頻信息保真度(VIF:Visual Quality Fidelity) 細節(jié)損失指標(DLM:Detail Loss Measure) 時域運動指標/平均相關位置像素差(TI:Temporal Information) VMAF基于SVM的nuSvr算法,在運行的過程中,根據事先訓練好的model,賦予每種視頻特征以不同的權重,對每一種畫面都生成一個評分,最終以均值算法進行歸總,算出該視頻的最終評分。
VMAF計算出的分數范圍是0 ~ 100,其中0表示最低質量,100表示最高質量,后續(xù)對比的時候只給出分數。
2.2 主觀標準


三、基礎優(yōu)化
VideoID : 1Format : AVCFormat/Info : Advanced Video CodecFormat profile : [email protected]Format settings : CABAC / 4 Ref FramesFormat settings, CABAC : YesFormat settings, Reference frames : 4 framesCodec ID : avc1Codec ID/Info : Advanced Video CodingDuration : 2 min 41 sBit rate : 634 kb/sBit rate mode : CBRWidth : 960 pixelsHeight : 540 pixelsDisplay aspect ratio : 16:9Frame rate mode : ConstantFrame rate : 25.000 FPSColor space : YUVChroma subsampling : 4:2:0Bit depth : 8 bitsScan type : ProgressiveBits/(Pixel*Frame) : 0.049Stream size : 12.2 MiB (94%)Writing library : x264 core 148Encoding settings : cabac=1 / ref=3 / deblock=1:0:0 / analyse=0x3:0x113 / me=hex / subme=7 / psy=1 / psy_rd=1.00:0.00 / mixed_ref=1 / me_range=16 / chroma_me=1 / trellis=1 / 8x8dct=1 / cqm=0 / deadzone=21,11 / fast_pskip=1 / chroma_qp_offset=-2 / threads=17 / lookahead_threads=2 / sliced_threads=0 / nr=0 / decimate=1 / interlaced=0 / bluray_compat=0 / constrained_intra=0 / bframes=3 / b_pyramid=2 / b_adapt=1 / b_bias=0 / direct=1 / weightb=1 / open_gop=0 / weightp=2 / keyint=75 / keyint_min=7 / scenecut=40 / intra_refresh=0 / rc_lookahead=40 / rc=crf / mbtree=1 / crf=26.0 / qcomp=0.60 / qpmin=0 / qpmax=69 / qpstep=4 / vbv_maxrate=800 / vbv_bufsize=1600 / crf_max=0.0 / nal_hrd=none / filler=0 / ip_ratio=1.40 / aq=1:1.00Codec configuration box : av
3.1 Profile
Baseline Profile
Main Profile
High Profile
3.2 Bitrate碼率
Bitrate = width * height * frameRate * factorfactor = 0.15
按照上面的公式設置的碼率是比較合適的,當然如果想要更加高清的,可以適當增加factor大小。
3.3 Bitrate Mode
VBR:可變碼率(Variable Bitrate), 此編碼方式會根據幀間數據的變化量大小來動態(tài)調整碼率,如果幀間的運動變化比較大,調高碼率,如果幀間的運動變化比較小,調小碼率。從編碼方式就可以看出來,這樣的編碼方式有兩個缺點:(1)運動預測計算算法有一定的耗時,編碼時間較長;(2)碼率多變,最終生成的文件大小不可預測。可能很大也可能很小。
CBR:固定碼率或者常數碼率(Constant Bitrate), 這是默認的編碼方式,使用此編碼方式,文件從始至終的編碼碼率會固定不變或者基本不變。這種方式的好處是文件大小是確定的,不會出現(xiàn)文件大小不可預測的情況。但是缺點也很明顯,有時候幀間變化比較大,有時候幀間變化比較小,如果都使用同樣的碼率,幀間變化比較大的時間畫質會比較一般,幀間變化比較小的時間顯得浪費。無法做到較好的平衡。
ABR:平均碼率(Average Bitrate), 平均碼率較好地兼顧了VBR和CBR的,在幀間變化比較大的時間使用較大的碼率,在幀間變化比較小的時間采用較小的碼率,最終保證整體采用的碼率固定就可以了。較好的處理了畫質和文件大小之間的矛盾。
BITRATE_MODE_CQ:這種模式是全面考慮視頻質量,盡可能保證視頻質量,所以編碼出來的視頻都很大,并不可取。 BITRATE_MODE_VBR:同上面的VBR BITRATE_MODE_CBR:同上面的CBR
3.4 B幀設置
四、HEVC編碼
HEVC標準視頻的幀內預測模式支持33種方向,并且提供了更好的運動補償處理和矢量預測方法。而H.264只支持8種。
HEVC采用了塊的四叉樹劃分結構,采用了8x8 ~ 64 x 64 像素的自適應塊劃分,而H.264每個宏塊的大小都是固定的16 x 16像素,HEVC的這樣設計可以保證在不同的幀間和幀內復雜程度中可以動態(tài)調整宏塊的大小,經過測試發(fā)現(xiàn),在相同的圖像質量下,HEVC編碼的視頻比H.264編碼的視頻約減少40%,換言之,如果HEVC和H.264碼率相同,那么HEVC編碼的視頻比H.264編碼的視頻要清晰地多。

分辨率 | H.264/AVC | H.265/HEVC |
480p | 1.5 Mbps | 0.75 Mbps |
720p | 3 Mbps | 1.5 Mbps |
1080p | 6 Mbps | 3 Mbps |
4k | 32 Mbps | 15 Mbps |
使用HEVC編碼,可以保證在不增加文件大小的情況下,大大提升視頻的清晰度。


五、色彩調優(yōu)
上面的幾種優(yōu)化方式都是在編碼層面調整參數或者直接改變編碼方式來提升視頻的畫質,但有一種方式通過調整視頻畫面的色值——綜合調整亮度、對比度、色溫、飽和度、銳度等顏色參數,進而優(yōu)化整體的視頻畫面,讓視頻畫面看上去“更清晰”。


有幾種對顏色色值的調節(jié)方式,對我們理解顏色調節(jié)有很大的幫助:
亮度:亮度表示人眼對發(fā)光體或被照射物體表面的發(fā)光或反射光強度實際感受的物理量,簡而言之,RGB分量越大,圖像就越亮;反之,圖像越暗。 對比度:圖像對比度是指圖像中從黑色到白色漸變的層次反差或比值。反差越大,比值越大,從視覺上感知,圖像就越清晰醒目,對比度越大;反差越小,比值越小,從視覺上感知,圖像越不清晰醒目,蒙塵感越強,對比度越小。
色溫:色溫和溫度還真有一定的關系,表示絕對黑體從絕對零度開始加熱之后呈現(xiàn)的顏色。從我們生活中來看,暖色調看上去比較溫馨,冷色調感受上有點清涼。
飽和度:飽和度是指色彩的鮮艷程度或者純度。飽和度越高,圖像色彩越鮮艷,色彩純度越高;反之則越低,直至灰度圖。 銳度:銳度主要用來表示圖像邊緣的對比度,由于人類感官,高銳度的圖像看起來更加清晰,圖像上的細節(jié)對比非常明顯。
亮度增加10個點(-100 ~ 100)
色溫增加5個點(-100 ~ 100)
飽和度增加20個點(0 ~ 100)
銳度增加15個點(0 ~ 100)


六、超分算法
目前比較成熟的超分技術是Real-ESRGAN,基于BasicSR,采用ESRGAN算法,利用機器學習的優(yōu)勢對圖片和視頻進行去模糊、Resize、降噪、銳化等處理,重建圖片,實現(xiàn)對圖片的超分辨率處理。
特征提取:計算噪點 非線性映射:放大,模糊化噪點 圖像重建:差分,平滑過度,去噪

改進感知損失,提高輸出圖像的邊緣清晰度和紋理真實性。 利用對抗網絡的優(yōu)勢不斷反饋改進GAN判別器,預測高分辨率圖像和原始圖像之前的相對真實性而不是絕對真實性。可以恢復原始圖像的真實的紋理細節(jié)。 優(yōu)化了模型的穩(wěn)定性,每次生成的圖片都和原圖片殘差對比,進行矯正訓練,最終得到的結果非常穩(wěn)定。





七、總結
參考文章:
VMAF開源項目 https://github.com/Netflix/vmaf 揭秘 VMAF 視頻質量評測標準 https://xie.infoq.cn/article/26aaf2ab83f56192a65ba22ea Netflix VMAF 視頻質量評估工具概述 https://zhuanlan.zhihu.com/p/94223056 B幀對視頻清晰度/碼率的影響 https://blog.csdn.net/matrix_laboratory/article/details/82726897 H264 vs H265 https://www.cnblogs.com/wujianming-110117/p/12640533.html 超分開源項目 https://github.com/xinntao/Real-ESRGAN
*文/Jeff Mony
