語音交互基礎知識(語言喚醒、語音識別、語音理解和語音合成)
語音喚醒指在待機的狀態下,用戶說出特定指令(喚醒詞)使設備進入工作狀態或完成某壹操作;當前更多應用於手機、可穿戴設備、車載設備、智能家居等。
語音識別技術,也被稱為自動語音識別,其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,後者嘗試識別或確認發出語音的說話人而非其中所包含的詞匯內容。
語音理解是指機器能夠結合上下文,自然地理解用戶的需求,並能給出正確以及人性化的反饋。
語音合成是通過機械的,電子的方法產生人造語音技術。語音合成的關鍵點是真人音色模擬,壹致性、流暢性、穩定和有情感。語音合成,又稱 文語轉換技術 ,能將任意文字信息實時轉化為標準流暢的語音朗讀出來,相當於給機器裝上了人工嘴巴。