亚洲精品国产自在现线看,国产一二三区高清免费播放器

首頁 > 芯片視界 > 語音百科 >

芯片視界

News

推薦產(chǎn)品

WT3000A離在線AI語音模組

WT588F02A-8S語音芯片IC

WT588F02B-8S語音芯片ic

WT2003H4 B001數(shù)碼管驅(qū)動語音芯片

芯片視界

國產(chǎn)離線語音芯片對比分析，哪個廠家才最適合你？

發(fā)布時間：2021-03-25 16:13 瀏覽次數(shù)：次

一、語音識別芯片的原理

定義：語音識別芯片即智能芯片，是指能聽懂并能對話的芯片。典型產(chǎn)品即小度、小愛。

語音識別的流程如下：

前端語音處理、模擬訓(xùn)練、后端識別處理

前端處理即把人聲或者采集的聲音轉(zhuǎn)化為機器能聽懂的機器音，并作信號優(yōu)化處理。

所需硬件鏈路：MIC-Codec/ADC/PDM-NPU/DSP

語音識別芯片工作原理.png

MIC麥克風(fēng)是采集音頻的關(guān)鍵硬件載體，關(guān)鍵參數(shù)是靈敏度和信噪比。

前端采集的原理簡單：音頻采集，一般通過麥克風(fēng)完成。通過麥克風(fēng)處理過后，再進行靜音切除，分偵加窗，降噪，預(yù)加重等一系列的處理。最后是特征提取，即提取主流信號匹配到匹配特征點

模擬訓(xùn)練：模擬就好比“查找詞典”，這需要前期有所輸入，即前期的語音數(shù)據(jù)采集，它形成記憶數(shù)據(jù)庫，通過模擬比對正確的語音和單詞，匹配答案。

后端識別又叫語音解碼，將“聲學(xué)模型”和“語言模型”匹配到采集的語音信號并輸出結(jié)果。

二、語音識別的比對

因為篇幅有限，本文盡可能言簡意賅。

語音識別技術(shù)目前有兩種，分為在線語音識別和離線語音識別。其實從字面理解就大體明白，一個支持聯(lián)網(wǎng)下工作，一個支持的是離線終端工作。在線語音一般基于手機和智能音箱，通過網(wǎng)絡(luò)傳送到云端服務(wù)器，資源更加強大，反而本地離線版僅支持硬件（MCN或者flash等）顯得比較匱乏。

離線語音識別目前的應(yīng)用主要體現(xiàn)在智能家電、語音遙控器、智能玩具、車載聲控、智能家居等。

我們重點就講這個離線型的語音芯片。

芯片對比參照說明：

識別距離&識別率：這個與消費者的體驗息息相關(guān)，當然與廠商的定位有關(guān)。

誤識別率：即準確性，用戶不希望對方突然插話，也不希望半夜突然說話

處理器：處理器有MCU和AUDIO Core識別，前者偏向于音頻信號和識別算法，后者偏向協(xié)同合作處理器。前者更加會影響語音識別的效率和準確性。

存儲：即容量，不解釋

語音算法：前端信號處理和后端信號識別算法。

音頻通道或外設(shè)接口：芯片與周邊器件的通信橋梁，對于語音識別來說，音頻的輸入和輸出更重要。

電源功耗：一般可以忽略

語音識別芯片.png

1.0&2.0傳統(tǒng)型

傳統(tǒng)算法模擬主流是GMM+HMM，或者模擬匹配即語音標簽。芯片的配置一般，沒有降噪功能，安靜環(huán)境下識別距離時2-5m，識別率達90%，條數(shù)3-5條。

處于成本考量和應(yīng)用行業(yè)特點，各家芯片都有不同的"性能短板"：外掛主控、外掛存儲、OTP固定詞條、詞條數(shù)少、接口單一、穩(wěn)定性差等等，這些短板，都是為了降低成本。

廠商分析

圍繞臺灣賽維算法，某臺灣芯片廠商大力推廣離線語音識別，國內(nèi)外許多電器廠多有嘗試，但是受限于技術(shù)，識別效果不佳，消費者滿意度低，退貨率較高。廠商損失慘重，因而語音識別技術(shù)基本被擱淺了。

但語音識別除了家電外，在玩具電子的應(yīng)用還是較高的，一個玩具電子的包容性比較強，另外臺灣的芯片支持多國語言識別，因而比較受歡迎。

另外上海有一家做語音的廠家，他們的軟件指令編碼比較齊全，但缺點是價格偏高，而且大股東之一也是北京的一家視覺識別大家的合伙人。

深圳唯創(chuàng)語音識別芯片的成本較低，語音播放芯片(OTP+MCU喇叭）多用于玩具開發(fā)中，芯片的開發(fā)集中在臺灣和廣東，但是如果從生產(chǎn)來講，基本集中在廣東區(qū)域，并且呈現(xiàn)一定的集群效應(yīng)。出口代工玩具在韶關(guān)，國內(nèi)玩具在汕頭澄海，產(chǎn)業(yè)集中代動了周邊的發(fā)展。

語音識別模塊數(shù)據(jù)庫.png

3.0分為互聯(lián)網(wǎng)&純芯片型

互聯(lián)網(wǎng)偏向于網(wǎng)絡(luò)，純芯片偏向于硬件部分。芯片語音處理核心為NPU，同等條件下，NPU能耗高于DSP。但其前端處理能力很強大，尤其是在降噪及遠場識別等功能。

從產(chǎn)品的角度來看，相較于在線語音識別，離線語音識別在硬件成本和軟件開發(fā)上投入成本較高。其明顯的優(yōu)勢是對于單向控制的應(yīng)用上，如風(fēng)扇、空調(diào)、照明上。目前唯創(chuàng)知音也在這塊有了幾大應(yīng)用了，明顯的就是小蜂管家。喚醒之后能進行簡單的語音對話。

從產(chǎn)業(yè)鏈的角度來看，國內(nèi)語音識別芯片原廠集中在北京和上海，深圳雖然有著發(fā)達的電子企業(yè)和成熟的芯片供應(yīng)體系。但芯片產(chǎn)業(yè)配套及國家基金支持、人才培養(yǎng)，北上更有優(yōu)勢。而且半導(dǎo)體行業(yè)屬于長期耗錢多，成效慢的行業(yè)。

上一篇：吵雜的環(huán)境中，為什么AI語音識別芯片很難聽懂指令？

下一篇：語音芯片如何選型？選擇產(chǎn)品合適聲音芯片的綜合因素

芯片視界

News

WT3000A離在線AI語音模組

WT588F02A-8S語音芯片IC

WT588F02B-8S語音芯片ic

WT2003H4 B001數(shù)碼管驅(qū)動語音芯片

國產(chǎn)離線語音芯片對比分析，哪個廠家才最適合你？

網(wǎng)站導(dǎo)航

應(yīng)用場景

智能物聯(lián)網(wǎng)

芯片視界

News

WT3000A離在線AI語音模組

WT588F02A-8S語音芯片IC

WT588F02B-8S語音芯片ic

WT2003H4 B001數(shù)碼管驅(qū)動語音芯片

國產(chǎn)離線語音芯片對比分析，哪個廠家才最適合你？

網(wǎng)站導(dǎo)航

應(yīng)用場景

智能物聯(lián)網(wǎng)

國產(chǎn)離線語音芯片對比分析，哪個廠家才最適合你？