其實現在的AI還沒那么智能,她無法在復雜的環(huán)境下區(qū)分有用的信息。只能聽懂簡單的指令,而無法辨別有用的信息。
比如您在吵雜的集市中能準確聽到你問小販:“這個蘋果多少錢?”但對于AI語音識別芯片來說卻很吃力,它就像一個貪玩的孩子,很容易被環(huán)境的其他聲音干擾。從而會出現執(zhí)行命令錯誤,無法捕捉到有用信息。
人的聽覺可以進行聲音識別,為什么語音芯片卻有點難?
人的聽覺系統(tǒng)有個著名的效應“雞尾酒效應”,它指的是在酒會上,參會者總能很輕松的把注意力集中到感興趣的話題上,其他無關緊要的卻自動過濾掉。
但對于智能音箱來說,這個卻不容易實現。當他們處于嘈雜的環(huán)境中,他們會受到不同的聲音連續(xù)暴擊,最后陷入到我是誰,我在干嘛的惡性循環(huán)中。
于是工程師爸爸想了很多辦法,希望它能專心工作,不被干擾。因而測試階段,都會讓它不斷學習。
淺析耳朵為啥可以分辨聲音?
要知道我們的耳膜不是直接暴露在空氣中的,通過頭發(fā),身體,肩膀,軀干等一系列部位反射,最后才進入到耳膜。由于聲波所走的路徑不同,經過多次反射之后的聲音他們的頻譜會發(fā)生變化。因而不同頻波的聲音傳送到大腦,它很容易區(qū)分,因為她們很有特色。
那么一開始大腦也是需要積累數據的,這可以從嬰兒時期觀察得到,小嬰兒對外界的聲音也是聽不懂的,那是她們的積累不夠,沒有充分的數據庫,因而沒辦法調用數據和它匹配,這也是為啥智能語音芯片也需要學習,因為在學習的過程中,它積累了自己的數據庫,能夠對數據進行分析改造。
機器辨音能力的獲得
如何讓機器和人一樣懂的分辨聲音?我們需要進行聲音改造,那么北京一位專家就發(fā)明了一種新材料,聲學材料,它能夠進行單聲道多聲源定位與分離。那么我們是如何讓他來進行辨音的呢?首先我們把這個特殊的聲學材料做的外殼套在麥克風上,經過這個聲學材料過濾掉的聲音再傳送給麥克風,就會形成差異化聲音。那么這樣的聲音就立即能夠被識別了嗎?答案是否定的,因為僅僅對聲音進行了處理,只是相當于耳蝸,那么需要經過大腦接受并進行識別,才能最后被理解。而這一步驟就涉及到了一串代碼,也叫算法。
Copyright (?) 2020 深圳唯創(chuàng)知音電子有限公司 版權所有 地址:深圳市寶安區(qū)福永街道大洋路90號中糧福安機器人智造產業(yè)園6棟2/3層 備案號:粵ICP備15026214號