竹间智能知识图谱实现行业知识全覆盖,助力企业实现增长

竹间智能 | 2022-12-01

  当前,知识图谱技术仍存在诸多难题,主要集中于两个方面:第一,依赖人工进行构建,从数据收集、数据清洗到数据比对,再到最后图谱构建等整个流程中,自动化程度低;第二,知识图谱构建工作仍然高度依赖专家的输入,且目前市面上知识图谱产品普遍具备较强的行业属性,产品通用性差,阻碍了技术规模化应用。

  为此,不少厂商已经开始探索平台化的解决方案。例如竹间智能,推出的Gemini认知智能平台主要就是基于认知计算建成,具备认知能力,可以打造企业级的知识工厂,将重要的文档资料进行结构化处理,进而自动构建知识图谱,建立智能化知识管理系统,解锁尘封的知识资产,并将其应用到产品研发、生产、营销、运营、服务等各大业务环节。那么,竹间智能的Gemini认知智能平台是怎么将千头万绪的数据“编织”成一幅井然有序的知识图谱呢?下面就为大家简明扼要地科普一下构建流程的“四部曲”。

  定义数据处理流。为了清洗转化及合并各类数据,竹间智能自建了一个结合数据转化工具与数据仓库的数据挖掘平台。为了降低使用门槛,竹间智能在数据转化工具画布中预定义了众多参数,方便非专业人士快速创建自己的“数据流”以进行预处理,最终形成数据池。此外,在Gemini认知智能平台的数据转化工具中,加入了带着竹间强大基因的多种NLP 算法,让算法模型触手可及。

  定义业务模型。由业务专家在知识建模本体Ontology画布中定义业务模型,其中重点考虑四个元素——概念、事件、属性、关系。将具体业务转变成抽象概念,用概念属性代表业务属性。业务概念与业务概念之间通过定义关系连接。在定义好业务模型之后,就可以把数据池连接到业务模型了,形成从数据库到图谱的数据流动。

  NER结合业务模型,将数据化零为整。数据导入图谱之后,储备了相当一部分常识性概念的NER模块就可以与用户建立业务的模型相结合,识别并抽取其中所有符合模型的实体,存入图谱,形成众多节点,最终聚集成知识树。

  提炼关系,连接实体,使数据互联。如果想要掌握知识之间的关系,或者是实体之间的关系,那必须要做好关系抽取。

  经过以上四个步骤,知识图谱的初步搭建就完成了,使用者可以在数据管理界面查看成功实现结构化的全部数据。有了这些结构化数据作为基础,便能衍生出众多神奇应用,特别是在知识搜索和推理这两个方面,知识图谱都表现出惊人的能力与潜力。