目前,研究工作進展緩慢,主要表現在理論上一直沒有突破。雖然各種新的修正方法不斷涌現,但其普遍適用性都值得商榷。
具體來講,困難主要表現在:
●語音識別系統的適應性差,主要體現在對環境依賴性強,即在某種環境下采集到的語音訓練系統只能在這種環境下應用,否則系統性能將急劇下降;另外一個問題是對用戶的錯誤輸入不能正確響應,使用不方便。
●高噪聲環境下語音識別進展困難,因為此時人的發音變化很大,像聲音變高,語速變慢,音調及共振峰變化等等,這就是所謂Lombard效應,必須尋找新的信號分析處理方法。
●語言學、生理學、心理學方面的研究成果已有不少,但如何把這些知識量化、建模并用于語音識別,還需研究。而語言模型、語法及詞法模型在中、大詞匯量連續語音識別中是非常重要的。
●我們對人類的聽覺理解、知識積累和學習機制以及大腦神經系統的控制機理等分面的認識還很不清楚;其次,把這方面的現有成果用于語音識別,還有一個艱難的過程。
[1] [2] 下一頁