語音交互基礎知識（語言喚醒、語音識別、語音理解和語音合成）

語音喚醒指在待機的狀態下，用戶說出特定指令（喚醒詞）使設備進入工作狀態或完成某壹操作；當前更多應用於手機、可穿戴設備、車載設備、智能家居等。

語音識別技術，也被稱為自動語音識別，其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入，例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同，後者嘗試識別或確認發出語音的說話人而非其中所包含的詞匯內容。

語音理解是指機器能夠結合上下文，自然地理解用戶的需求，並能給出正確以及人性化的反饋。

語音合成是通過機械的，電子的方法產生人造語音技術。語音合成的關鍵點是真人音色模擬，壹致性、流暢性、穩定和有情感。語音合成，又稱文語轉換技術，能將任意文字信息實時轉化為標準流暢的語音朗讀出來，相當於給機器裝上了人工嘴巴。