2023移動端技術探索
1. 行業(yè)背景
過去的2022年對大家來說都是困難的一年,難在疫情影響,難在宏觀環(huán)境的增長放緩。沒有增長帶來的就是痛苦的體驗,對于互聯(lián)網行業(yè),21年的主題是“反996”,到了22年風向就變成了“降本增效”、“業(yè)務搜索”以及“裁員”。再細化動移動端,經過十年的發(fā)展,它已經步入“成熟期”,各行各業(yè)都被改造差不多了,技術上該有的輪子都有了,基礎的服務也搭建差不多了,似乎真正到達瓶頸了,存量時代的小修小補對人力的需求已經是對半砍了。脈脈《搶灘數(shù)字時代·人才遷徙報告2023》報告顯示:2022年企業(yè)招聘總職位數(shù)量同比減少21.67%,純互聯(lián)網職位量同比減少50.4%。

又到了制定新一年OKR的時候了,大家都在發(fā)愁技術項目的規(guī)劃,不知道在技術上去做哪些探索和突破。 InfoQ發(fā)布的《中國軟件技術發(fā)展洞察和趨勢預測研究報告2023》第三條核心結論顯示: 2022年技術服務理念轉變,從技術先進到業(yè)務賦能,IT部門公司定位逐漸由成本部門轉向業(yè)務賦能部門,技術也更被邊緣化了,個人職業(yè)發(fā)展屏障出現(xiàn),這個時候我們不禁對前途迷茫甚至產生質疑。 再細化到移動端,《中國軟件技術發(fā)展洞察和趨勢預測研究報告2023》展示的“中國技術成熟度評估曲線”中前沿和早期推廣項目貌似都與移動端沒有太大關系。

本文嘗試從各個方面探索移動端可以發(fā)展的方向,最大程度的“壓榨”可能的技術方向(有些只是拋出問題,而不是最終答案)。
2. 近兩年大廠探索方向與成果
在挖掘之前先看看大廠(可能是某個領域有所建樹)這些年在做什么,看看有沒有直接可以抄的作業(yè)。
2.1 21年初調研結果
21年初寫OKR時對幾個大廠做了調研,下面分別看看阿里、美團、京東做了什么,準備做什么:
阿里移動端技術全景圖

阿里移動端發(fā)展趨勢

美團移動端技術全景圖
京東移動端技術全景圖

京東移動端未來遠景圖

看起來都大同小異,可能各個規(guī)模的公司都在建設或者建設完成。
2.2 22年產出
再看看22年大廠的輸出,這里主要來自于企業(yè)技術公眾號輸出內容。
2.2.1 阿里
阿里推出的《2022技術人的百寶黑皮書》總結了2022年阿里年度精選終端技術棧的內容:

2.2.2 美團
下面內容摘自美團技術發(fā)布的《2022年美團技術年貨-合輯》:

2.2.3 百度
百度App技術公眾號發(fā)布2022精選文章:

2.2.4 分析
從上面三家企業(yè)對外輸出的文章看,在移動端的動作不外乎幾個方向:
-
跨端/低代碼
-
性能優(yōu)化
-
自動化測試
-
開發(fā)平臺/平臺化能力
-
AI
3. 移動端主要方向分析
結合上面整理出來的,我們看看移動端“可以”有哪些方向。
3.1 業(yè)務開發(fā)
業(yè)務開發(fā)還是主流的市場需求,這塊會占大部分的比例,IT部門從成本部門轉為賦能部門后,主要的工作量就是支持業(yè)務。
3.2 跨端/低代碼
在降本增效的背景下,跨端還會持續(xù)搞,但是也不是新東西了。H5、React、Flutter、小程序,這些都各有利弊,不同場景用不同技術,像小程序這種更適合平臺化的超級APP,規(guī)模不夠大的話,性價比不高。
3.3 性能優(yōu)化
同樣的,性能優(yōu)化也是需要持續(xù)做的事情,但是也不是新東西了,一些技術手段都比較成熟了,沒有太多可挖掘的空間了。
3.4 架構方向
架構管理方向隨著規(guī)模的收縮,很難出現(xiàn)機會了。
3.5 開發(fā)平臺建設
在公司內部,類似于螞蟻的mPaas開發(fā)平臺在業(yè)務快速成長期對提效會有很大的幫助,這個時候隨著業(yè)務的裂變,推出各種APP,開發(fā)平臺可以避免很多重復的工作,助力應用快速上線和運營,但是在收縮期再去建設就有點不劃算了。
單點的平臺能力,比如監(jiān)控、埋點之類的或者用第三方或者也自建完成了,對缺失的個別能力,可以根據(jù)業(yè)務需求點滴建設。
3.6 系統(tǒng)應用/Framework/驅動開發(fā)
隨著AI、Iot、新能源的發(fā)展與興起,釋放出一些系統(tǒng)開發(fā)的訴求,相對于之前,嵌入式驅動開發(fā)的薪資也有所增長,也算是一個方向,但是也要記住,比起手機,電視、汽車畢竟是少數(shù),如果純轉嵌入式的話可能沾Iot的光規(guī)模更大些,不過比起芯片,這也是比較成熟的技術,可挖掘方向不大,只是多了個寫業(yè)務的戰(zhàn)場。
3.7 XR
目前比較成熟的是VR,但是VR在端上展示主要基于H5,采集會有單獨硬件,有些也支持了手機采集,但是還是那句話,市場需求不大。至于AR、元宇宙更多的是AI的綜合應用了,我們也不討論了。
3.8 音視頻
音視頻一直是移動端比較大和前沿的一塊方向,但是現(xiàn)在也已趨于成熟,下面看看主要的幾個方向:
-
點播:播放器的事情,主要涉及多解碼期、預加載秒開,剩下的交給系統(tǒng)播放器都可以完成的很好了;
-
錄制:系統(tǒng)錄制工具,或者基于系統(tǒng)采集、編碼、封裝封裝一套;
-
視頻編輯和特效處理:編輯主要是解復用--->解碼--->逐幀處理--->編碼--->復用的過程,逐幀處理用到視頻上主要設計合成、濾鏡等;音頻主要是變聲、聲音融合,都是通用的技術,稍微體現(xiàn)差異的就是特效處理中與AI的結合,比如美顏、帶眼鏡等會用到圖像檢測,但是都不是門檻,也談不上前沿探討;
-
直播:直播也同樣有成熟的結局方案:采集推流,開源服務端以及成熟CDN,播放ijk,秒開之類的都是參數(shù)優(yōu)化了;
-
實時音視頻:實時音視頻開發(fā)成本比較高,主要的挑戰(zhàn)是弱網對抗,3A處理等,由于不是通用協(xié)議,沒有CDN,自己搭建機房成本高,而且不見得效果比第三方好,所以也是一件性價比比較低的事情。
-
編解碼:目前主流的還是H264,VP8,H264甚至都沒有推開,限制編解碼算法的主要是推廣和兼容性,所以編解碼器都是一些組織去搞,一個公司貿然去開發(fā),風險很大。
3.9 AI
人類一直在追求更智能的機器,AI是未來,所以即使現(xiàn)在不夠好,并且沒有找到太多的落地場景,但是很多公司還在搞,尤其是ChatGPT的能力讓大家驚訝,但是它仍然不是真正的“像人類一樣”的智能。目前通用的AI主要有一下幾個方向:
-
語音方向
-
前端信號處理
-
喚醒
-
語音識別
-
聲紋
-
TTS
-
作曲:抖音之前分享有過這方面實踐和應用
-
基于特征的語音編碼:比如谷歌推出的的lyra和SoundStream,Lyra的設計工作速率為3kbps,聽力測試表明,在該比特率下,Lyra的性能優(yōu)于任何其他編解碼器,并優(yōu)于Opus的8kbps,因此實現(xiàn)了60%以上的帶寬削減。但是正如上面說的,編解碼器的瓶頸主要還是在于標準的推廣。
-
-
圖像方向
-
檢測
-
識別
-
圖像比較(應用于UI自動化測試)
-
-
自然語言處理
-
智能問答
-
意圖識別
-
-
風控
-
推薦
-
用戶畫像
-
元宇宙/數(shù)字人:數(shù)字人更像是一個AI的綜合應用。
還有些特殊的特殊業(yè)務場景的特殊用戶,比如房產領域:
-
戶型解讀(基于圖像的特殊特征)
-
訓練場
對于AI,移動端可以做哪些探索?
回答這個問題先要搞明白哪些場景適配放在端上來做。
Android官方給了一個決策的標準:

上面提到的特別需要在端上應用的主要有:
-
喚醒
-
圖像檢測
-
語音編解碼
可以放在端上應用的:
-
ASR
-
TTS
-
圖像標簽
基于這些場景端上的主要工作量是什么呢?模型訓練大部分還是放在云端,端上就是加載模型,輸入數(shù)據(jù),展示輸出結果,還有可能就是對引擎,框架做些優(yōu)化:

4. 總結
整體來看,整個移動端技術的發(fā)展可以說到了“山窮水盡”的地步,可挖掘的創(chuàng)新型內容不是很多了,大部分都是在現(xiàn)有體系維護和迭代。整體來看業(yè)務支撐還是主要的需求來源,車機、Iot也釋放出一些機會,跨端、開發(fā)平臺、性能優(yōu)化、VR已趨于成熟,端智能落地的還是語音、圖像這些通用的方向,深度結合業(yè)務的還有待挖掘。目前的AI解決的還是“決策”問題,從現(xiàn)在生成式到未來創(chuàng)造式通用的、”人類水平“的“智能”還有很長的路要走,誰也不能打包票說雷·庫茲韋爾提出的奇點理論的“奇點”能不能到來,什么時候到來,智能的進化不止是算法層面的,還會收到算力的影響,像《流浪地球》系列中的MOSS機器人是因為量子計算機算力快的加成。
