性插爽视频欧美_久久国产精品视频_精品国产美女福到在线不卡f_国语自产精品视频_九色精品视频在线观看_国内精品视频九九九九_中文成人久久久久影院免费观看_国产成人综合色在线观看网站_国产精品亚洲αv天堂无码_18禁无遮挡羞羞污污污污免费

歡迎訪問深圳唯創(chuàng)知音電子有限公司官網(wǎng)!| 全國統(tǒng)一服務(wù)熱線:4008-122-919

國產(chǎn)離線語音芯片對比分析,哪個廠家才最適合你?

發(fā)布時間:2021-03-25 16:13 瀏覽次數(shù):


一、語音識別芯片的原理

定義:語音識別芯片即智能芯片,是指能聽懂并能對話的芯片。典型產(chǎn)品即小度、小愛。

語音識別的流程如下:

前端語音處理、模擬訓(xùn)練、后端識別處理

前端處理即把人聲或者采集的聲音轉(zhuǎn)化為機器能聽懂的機器音,并作信號優(yōu)化處理。

所需硬件鏈路:MIC-Codec/ADC/PDM-NPU/DSP

語音識別芯片工作原理.png

MIC麥克風(fēng)是采集音頻的關(guān)鍵硬件載體,關(guān)鍵參數(shù)是靈敏度和信噪比。

前端采集的原理簡單:音頻采集,一般通過麥克風(fēng)完成。通過麥克風(fēng)處理過后,再進行靜音切除,分偵加窗,降噪,預(yù)加重等一系列的處理。最后是特征提取,即提取主流信號匹配到匹配特征點

模擬訓(xùn)練:模擬就好比“查找詞典”,這需要前期有所輸入,即前期的語音數(shù)據(jù)采集,它形成記憶數(shù)據(jù)庫,通過模擬比對正確的語音和單詞,匹配答案。

后端識別又叫語音解碼,將“聲學(xué)模型”和“語言模型”匹配到采集的語音信號并輸出結(jié)果。

二、語音識別的比對

因為篇幅有限,本文盡可能言簡意賅。

語音識別技術(shù)目前有兩種,分為在線語音識別和離線語音識別。其實從字面理解就大體明白,一個支持聯(lián)網(wǎng)下工作,一個支持的是離線終端工作。在線語音一般基于手機和智能音箱,通過網(wǎng)絡(luò)傳送到云端服務(wù)器,資源更加強大,反而本地離線版僅支持硬件(MCN或者flash等)顯得比較匱乏。

離線語音識別目前的應(yīng)用主要體現(xiàn)在智能家電、語音遙控器、智能玩具、車載聲控、智能家居等。

我們重點就講這個離線型的語音芯片。

芯片對比參照說明:

識別距離&識別率:這個與消費者的體驗息息相關(guān),當然與廠商的定位有關(guān)。

誤識別率:即準確性,用戶不希望對方突然插話,也不希望半夜突然說話

處理器:處理器有MCU和AUDIO Core識別,前者偏向于音頻信號和識別算法,后者偏向協(xié)同合作處理器。前者更加會影響語音識別的效率和準確性。

存儲:即容量,不解釋

語音算法:前端信號處理和后端信號識別算法。

音頻通道或外設(shè)接口:芯片與周邊器件的通信橋梁,對于語音識別來說,音頻的輸入和輸出更重要。

電源功耗:一般可以忽略

語音識別芯片.png

1.0&2.0傳統(tǒng)型

傳統(tǒng)算法模擬主流是GMM+HMM,或者模擬匹配即語音標簽。芯片的配置一般,沒有降噪功能,安靜環(huán)境下識別距離時2-5m,識別率達90%,條數(shù)3-5條。

處于成本考量和應(yīng)用行業(yè)特點,各家芯片都有不同的"性能短板":外掛主控、外掛存儲、OTP固定詞條、詞條數(shù)少、接口單一、穩(wěn)定性差等等,這些短板,都是為了降低成本。

廠商分析

圍繞臺灣賽維算法,某臺灣芯片廠商大力推廣離線語音識別,國內(nèi)外許多電器廠多有嘗試,但是受限于技術(shù),識別效果不佳,消費者滿意度低,退貨率較高。廠商損失慘重,因而語音識別技術(shù)基本被擱淺了。

但語音識別除了家電外,在玩具電子的應(yīng)用還是較高的,一個玩具電子的包容性比較強,另外臺灣的芯片支持多國語言識別,因而比較受歡迎。

另外上海有一家做語音的廠家,他們的軟件指令編碼比較齊全,但缺點是價格偏高,而且大股東之一也是北京的一家視覺識別大家的合伙人。

深圳唯創(chuàng)語音識別芯片的成本較低,語音播放芯片(OTP+MCU喇叭)多用于玩具開發(fā)中,芯片的開發(fā)集中在臺灣和廣東,但是如果從生產(chǎn)來講,基本集中在廣東區(qū)域,并且呈現(xiàn)一定的集群效應(yīng)。出口代工玩具在韶關(guān),國內(nèi)玩具在汕頭澄海,產(chǎn)業(yè)集中代動了周邊的發(fā)展。

語音識別模塊數(shù)據(jù)庫.png

3.0分為互聯(lián)網(wǎng)&純芯片型

互聯(lián)網(wǎng)偏向于網(wǎng)絡(luò),純芯片偏向于硬件部分。芯片語音處理核心為NPU,同等條件下,NPU能耗高于DSP。但其前端處理能力很強大, 尤其是在降噪及遠場識別等功能。

從產(chǎn)品的角度來看,相較于在線語音識別,離線語音識別在硬件成本和軟件開發(fā)上投入成本較高。其明顯的優(yōu)勢是對于單向控制的應(yīng)用上,如風(fēng)扇、空調(diào)、照明上。目前唯創(chuàng)知音也在這塊有了幾大應(yīng)用了,明顯的就是小蜂管家。喚醒之后能進行簡單的語音對話。

從產(chǎn)業(yè)鏈的角度來看,國內(nèi)語音識別芯片原廠集中在北京和上海,深圳雖然有著發(fā)達的電子企業(yè)和成熟的芯片供應(yīng)體系。但芯片產(chǎn)業(yè)配套及國家基金支持、人才培養(yǎng),北上更有優(yōu)勢。而且半導(dǎo)體行業(yè)屬于長期耗錢多,成效慢的行業(yè)。

 

 


語音芯片_語音芯片廠家_錄音IC_語音識別方案-唯創(chuàng)知音

Copyright (?) 2020 深圳唯創(chuàng)知音電子有限公司 版權(quán)所有  地址:深圳市寶安區(qū)福永街道大洋路90號中糧福安機器人智造產(chǎn)業(yè)園6棟2/3層 備案號:粵ICP備15026214號