<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          百度語音識別技術

          聯(lián)合創(chuàng)作 · 2024-08-28 16:41

          優(yōu)勢能力

          完全永久免費

          業(yè)界首創(chuàng)完全永久免費新形式,為開發(fā)者提供基于百度大腦的業(yè)界頂級聲學模型和語音模型。完全免費,永久使用,徹底擺脫有效期限制。

          全平臺REST API

          行業(yè)率先推出語音識別全平臺REST API,再也不用糾結(jié)沒有SDK、SDK包太大,采用http方式請求,可適用于任何平臺的語音識別,給你最大自由度!

          離線在線融合模式

          SDK可以根據(jù)當前網(wǎng)絡狀況及指令的類型,自動判斷使用本地引擎還是云端引擎進行語音識別,極速識別、流量節(jié)省兩不誤!

          深度語義解析

          支持多達35個垂類領域的語義理解定制,以及和問答對設置。讓你的應用理解用戶的意圖!

          場景識別定制

          開發(fā)者可根據(jù)使用場景,自定義設置識別垂類模型。有音樂、視頻、地圖、游戲、電商共17個垂類可供選擇。一步設置,精準到位!

          自定義上傳語料、訓練模型

          開發(fā)者可以自行上傳詞庫,訓練專屬識別模型。提交的語料越多、越全,語音識別的效果提升也會越明顯。

          接入指南

          注冊百度開發(fā)者

          使用百度語音技術服務首先需要注冊成為百度開發(fā)者,如果您在登陸百度賬號后進入“應該管理”出現(xiàn)如下提示,說明您的百度賬號還沒有注冊成為百度開發(fā)者。請按要求填寫開發(fā)者信息并完成百度開發(fā)者的注冊。

          創(chuàng)建應用

          在首頁登陸已經(jīng)注冊為開發(fā)者的百度賬號,然后點擊頁面上方的“應用管理”進入應用管理頁面。如果您之前在創(chuàng)建過應用,則會出現(xiàn)您之前曾經(jīng)創(chuàng)建過的應用;如果您之前沒有創(chuàng)建過應用,則需要新創(chuàng)建一個應用。

          1、點擊右上角填寫應用名稱并選擇應用垂類信息,即可創(chuàng)建一個新的應用。

          2、創(chuàng)建成功后,新創(chuàng)建的應用會出現(xiàn)在應用列表最上方的位置。

          3、點擊“查看Key”可以查看當前應用的AppID、 API Key、Secret Key信息。

          開通服務

          如果您曾經(jīng)在百度開發(fā)者中心管理控制臺申請開通了語音技術服務,在這里您可以直接使用;對于新創(chuàng)建或從未開通語音技術服務的應用,則需要開通語音技術服務之后才可以使用。

          1、點擊應用卡片上的按鈕,選擇“語音識別”服務進行開通。

          2、“語音識別”服務開通成功后即可獲得50000次/天的在線調(diào)用次數(shù)配額。

          申請?zhí)岣吲漕~

          如果開通服務時初始分配的在線服務調(diào)用配額無法滿足您的需求,可以申請?zhí)岣吲漕~。

          1、點擊對應服務的“管理”在下拉列表中選擇“申請?zhí)岣吲漕~”。填寫詳細的預計日調(diào)用次數(shù)、應用介紹等信息后提交。管理員會在1個工作日內(nèi)完成審核。

          2、如果審核通過,則當前應用該服務的日調(diào)用次數(shù)將不再受配額限制。如果審核被拒絕,您可以再次提交申請。

          申請離線授權

          選擇應用的語音識別的管理菜單,點擊“申請離線License”。

          選擇應用類型為Android或者iOS,填寫并提交離線授權所需信息:Android應用為應用包名和簽名MD5值,iOS應用為Bundle ID。提交成功后即獲取離線識別正式授權。

          注:請確保填寫提交的信息準確,否則會無法通過離線授權驗證導致離線識別不可用。

          如果暫時沒有應用包名或者簽名信息,可以先下載臨時License文件,并集成到本地項目中進行測試使用。臨時License有效期為30天,失效后請申請正式license,并從您的項目中刪除臨時的license。

          開發(fā)集成

          前往語音識別服務相關下載頁面,下載開發(fā)所需的 SDK 及開發(fā)文檔到本地進行集成開發(fā)。

          常見問題

          Q:語音識別REST API支持的音頻格式、采樣率有哪些?

          A:支持的壓縮格式有:pcm(不壓縮)、wav、opus、speex、amr、x-flac。原始 PCM 的錄音參數(shù)必須符合 8k/16k 采樣率、16bit 位深、單聲道。

          Q:語音識別 REST API 最長支持多長的錄音?

          A: 最長支持60s的錄音文件。對文件大小沒有限制,只對時長有限制。

          Q:語音識別SDK支持的音頻格式、采樣率有哪些?

          A:

          Android SDK:支持Android 2.2及以上系統(tǒng),支持ARM\。安裝包最小增加200k,支持8k/16k采樣率,支持pcm格式。

          iOS SDK:支持iOS 5.0及以上系統(tǒng),支持ARM-v7\ARM-v7s\ARM64\i386\x86_64架構(gòu)。安裝包最小增加400k,支持8k/16k采樣率,支持pcm格式。

          Q:什么是語音識別REST API?有什么注意事項?

          A:語音識別全平臺REST API,采用http方式請求,可適用于任何平臺的語音識別。使用REST API,錄音、壓縮及上傳模塊需要自行開發(fā)。且REST API語音識別暫時不支持語義解析。

          Q:百度語音是否單獨提供錄音功能,以及語音通訊功能?

          A:不單獨提供獨立錄音的功能,識別SDK包含語音輸入和識別功能。語音通訊功能需開發(fā)者自行搭建。

          Q:語音識別REST API和SDK的區(qū)別是什么?

          A: REST API:開發(fā)者上傳錄音——百度語音進行識別——識別結(jié)果返回開發(fā)者

          SDK:百度語音提供從錄音到識別結(jié)果返回的

          Q:語音識別通過哪個接口獲取音頻信息?

          A:

          Android SDK:當VoiceClientStatusChangeListener.onClientStatusChange(int status, Object obj) 的status是VoiceRecognitionClient.CLIENT_STATUS_AUDIO_DATA時,obj為byte[]音頻數(shù)據(jù);

          iOS SDK:MVoiceRecognitionClientDelegate的(void)VoiceRecognitionClientWorkStatus:(int) aStatus obj:(id)aObj;的aStatus是EVoiceRecognitionClientWorkStatusNewRecordData時,aObj為NSData音頻數(shù)據(jù)。

          數(shù)據(jù)格式均為pcm,采樣率可通過VoiceRecognitionConfig.getSampleRate()/[[BDVoiceRecognitionClient sharedInstance] getCurrentSampleRate]獲取,獲取的音頻格式是位深16bit,單聲道。

          Q:如何才能提高語音識別的準確率?

          A: 自定義語音識別設置:打開百度開放云平臺,在創(chuàng)建的應用下進行自定義語音識別設置。上傳識別關鍵詞文本,保存并生效。

          設置對應的語音識別垂類:在代碼中填寫識別的垂類領域,識別結(jié)果將優(yōu)先指向已設置的垂類,可以使得識別結(jié)果更準確

          Q:百度語音SDK與其他百度SDK,或其他第三方SDK沖突時,如何解決?

          A: 與其他百度SDK沖突一般是由于使用了相同的基礎庫galaxy.jar,請檢查是否重復導入了該jar包;與其他第三方SDK沖突一般是由于so庫的架構(gòu)不統(tǒng)一,請保證工程libs目錄下armeabi/armeabi-v7a/x86/mips目錄的so庫均一致,如果不能保證一致,則一般只能所有SDK僅使用armeabi架構(gòu)的so庫

          Q:首次開啟語音識別功能的延遲時間較長,需要如何調(diào)控?

          A: 首次延遲時間較長一般是由于權限驗證造成,可以通過預先調(diào)用接口:

          (int)verifyApiKey:(NSString)apiKey withSecretKey:(NSString)secretKey;

          來進行驗證。首次開啟語音時就不需要再發(fā)送驗證請求,從而降低語音識別啟動的延遲。

          Q:如何在語音識別時獲取音頻文件?

          A:

          Api:cp服務器自己備存用戶錄音信息

          Sdk:可以通過CLIENT_STATUS_AUDIO_DATA回調(diào),將回調(diào)對象強轉(zhuǎn)成byte[]順序?qū)懭氲轿募屑纯傻玫皆嫉囊纛l文件。

          Q:語音識別垂類是什么意思?

          A: 語音識別垂類就是特指某個領域的意思,開發(fā)者可以根據(jù)用戶使用場景設定特定領域使得識別結(jié)果更準確。比如垂直領域設定為”音樂“,則在語音識別時會優(yōu)先識別為音樂相關的歌曲名歌手名或者歌詞。

          Q:為什么語音識別Demo的API_Key和Secret_Key是空的還能進行識別呢?我開發(fā)的應用的API_Key和Secret_Key是不是必須得填寫呢?

          A: SDK自帶demo用的特殊的方式驗證的,故可以不使用AK和SK。開發(fā)者自行開發(fā)的應用AK和SK是必須填寫的,否則無法調(diào)用語音識別。

          瀏覽 170
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  黄片视频免费看 | 午夜福利剧场 | 伊人97| 亚洲自拍欧美色图 | 亚洲观看黄 色 网 |