基于医疗知识图谱的问答系统

1 简介

一个以疾病为中心的一定规模医药领域知识图谱，并以该知识图谱完成自动问答与分析服务。

此项目立足医药领域，以39健康网为数据来源，以疾病为核心，构建起一个包含7类规模约为3.7万的知识实体，6类规模约21万的实体关系的知识图谱。基于上述的知识图谱进行自动问答。

垂直型网站(Vertical website)：注意力集中在某些特定的领域或某种特定的需求，提供有关这个领域或需求的全部深度信息和相关服务。

neo4j的预训练词向量：来源下载链接

ubuntu安装py2neo：pip install py2neo

通过运行项目，Department(科室)这一实体的图为： (其余省略)

通过运行项目，HAS_SYMPTOM(症状有)这一实体关系的图为： (其余省略)

识别用户查询意图利用特征词分类的方法，采用朴素贝叶斯(Naive Bayes)算法训练得到意图分类模型。

意图类别比较少，项目的分类模型只能预测出上面设定的7类意图。对于问题句子中有多个意图的情况只能预测出一类。

从图里能明显看出来，现在程序问题回答的不尽人意，遇到有些问题意图识别和答案查找很慢。知识图谱还比较小，对于许多问题都检索不出答案。

程序也只能进行单轮对话。