聊天機器人中文語意識別的精確性

聊天機器人的中文語意識別,其重點是在對是對句子的意圖(語意)可以做深入的理解,而深入是指什麼呢?

當您的聊天機器人面對使用人,使用”幹話”時, 您的機器人,只是我無法理解您的問題,或者用其它的語句或選項方式帶過嗎? 請看下圖的回應: 對於它是”不雅文字”的confidence”0.987866640090942, 並把這個字詞標記出來!

我們來看看同樣是”你是誰”(Who are you) 卻有不同的結果, 在中文部分: confidence則為 0.45487883687019304, 在英文部分其confidence則為 0.270541936159133, 而我們把閾限設為0.45, 也就是大於0.45時, 則把它語意視為問”你是誰”的意圖(intent), 小於0.45時, 字義是為who are you? 但意圖(intent)是被視為bot_can_do , ! 為什麼有這樣的差異呢?

當然, 這的差異來自於對話設計的組數少於10句以下, 如果增加對話設計的內容時, 這樣意圖(intent)就容易被識別出來!

對於這樣過少的對話設計時, 它必須在程式控制中增加篩選機制, 若是有實體(entity)在字句中時, 就更容易呈現了!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *