QuestionAnsweringSystem人機問答系統(tǒng)
QuestionAnsweringSystem是一個Java實現(xiàn)的人機問答系統(tǒng),能夠自動分析問題并給出候選答案。IBM人工智能計算機系統(tǒng)"沃森"(Watson)在2011年2月美國熱門的電視智力問答節(jié)目"危險邊緣"(Jeopardy!)中戰(zhàn)勝了兩位人類冠軍選手,QuestionAnsweringSystem就是IBM Watson的Java開源實現(xiàn)。
系統(tǒng)架構(gòu)如下:
工作原理:
1、判斷問題類型(答案類型),當(dāng)前使用模式匹配的方法,將來支持更多的方法,如樸素貝葉斯分類器。 2、提取問題關(guān)鍵詞。 3、利用問題關(guān)鍵詞搜索多種數(shù)據(jù)源,當(dāng)前的數(shù)據(jù)源主要是人工標注的語料庫、谷歌、百度。 4、從搜索結(jié)果中根據(jù)問題類型(答案類型)提取候選答案。 5、結(jié)合問題以及搜索結(jié)果對候選答案進行打分。 6、返回得分最高的TopN項候選答案。
目前支持5種問題類型(答案類型):
1、人名
如:
APDPlat的作者是誰?
APDPlat的發(fā)起人是誰?
誰死后布了七十二疑冢?
2、地名
如:
“海的女兒”是哪個城市的城徽?
世界上流經(jīng)國家最多的河流是哪一條?
世界上最長的河流是什么?
漢城是哪個國家的首都?
3、機構(gòu)團體名
如:
BMW是哪個汽車公司制造的?
長城信用卡是哪家銀行發(fā)行的?
美國歷史上第一所高等學(xué)府是哪個學(xué)校?
4、數(shù)字
如:
全球表面積有多少平方公里?
撒哈拉有多少平方公里?
北京大學(xué)占地多少平方米?
撒哈拉有多少平方公里?
5、時間
如:
大慶油田是哪一年發(fā)現(xiàn)的?
評論
圖片
表情
