智能聊天機器人對你的輸入的文字了解有多少呢?

您開發的智能聊天機器人對你的輸入的文字了解有多少呢? 如果,用過Google的Dialogflow , 應該不知這句話的意義, 因為在Dialogflow 只會有兩種回應,一是符合對話的回應,一是不符合對話內容範圍預設的統一回應, 你知道機器人與你的想像中的了解是多少呢?

如果, 你的對話機器人的中文語意識別引擎,可以提供在意圖及實體在參考的數字時,是否更能讓開發者更能判定如何提升回應的準確性,對於您的對話機器人是不是更有改善的機器呢?

這是一個傳入到話機器人的中文語意識別引擎的資料內容:

{
“sender”:”robin@anydomainname.com”,
“key”:”c072-8729-49fb-0d7a-x0d8″,
“message”:”幫我轉接給財務部門的簡明仁先生”
}

這些資料送入經過”中文語意識別引擎”訓練後的模型後, 回應如下:

Array
(
[reply_text] => 好的!我為您轉接簡明仁先生/小姐
[user_input] => 幫我轉接給財務部門的簡明仁先生
[user_intent] => Array
(
[name] => get_financial_service_man
[confidence] => 0.65287637710571
)
[entity] => Array
(
[0] => Array
(
[start] => 10
[end] => 13
[value] => 簡明仁
[entity] => person_name
[confidence] => 0.52213108894648
[extractor] => CRFEntityExtractor
)
)
)

你可以看到中文語意識別的機器人的回應,除了有文字的回應(好的!我為您轉接簡明仁先生/小姐), 也有意圖的回應(user_intent:get_financial_service_man & confidence: 0.65287637710571), 也有實體的回應數字(

entity: person_name & confidence: 0.52213108894648), 如果, 你是開發者,你是否會更放心呢?
當然,你會問如何提升confidence的值呢? 你可以用以下三種的方式來提升:
  1. 增加問話的內容,成為訓練的資料集—-目前,這個”中文語意識別引擎”, 只提供10個使用者問話的方式, 就能提供了正確的回應,如果有更多問話更能準確的應!
  2. 在結巴斷詞的增加自訂字典的字詞—-目前大多數使用的Wiki的語料庫,有些語句不是在Wiki的資料中,所以, 經由自訂字典方式來增加其準確性, 如身份證,結巴斷詞,會把它分成”身份”及”證”,如果你把它加入自訂字典時,它就可以識別出身份證這個字詞!
  3. 檢測例外的情況—-這一部分是最難的一部分,在Dialogflow採用了default fallback的概念,將它打入了同一種的回應內容,如果,在某一閾限(激活函數的閾值,如:0.7或0.4), 在中文語意識別引擎提供了數值時,對於開發人員,就有改善的方案。

你想試試看這樣的中文語意識別引擎嗎?請留言,我將會私訊給你測試的API及key….

以下是用postman的所做的輸入及回應之結果

 

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *