知识图谱

2012年5月,谷歌公司通过其官方博客正式发布搜索页面的新功能——知识图谱(Mapping Knowledge Domain)。这可能是谷歌搜索引擎上线以来最大的一次改革。

  什么是知识图谱?

  知识图谱也被称为科学知识图谱,是显示知识发展进程与结构关系的一系列不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。具体来说,知识图谱是把应用数学、图形学、信息可视化技术、信息科学等学科的理论与计量学引文分析等方法结合,用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。

  下面我们先来举一个实例进行说明,比如我们在谷歌搜索框里输入“十三陵”,以往只能在搜索结果页面显示10多个由标题、链接以及与关键词相关的简短内文片段组成的搜索结果。虽然现在搜索页面也会插入图片等结果,不过搜索结果大体上依然通过文字简介的形式提供。

  如果使用知识图谱搜索则不同,当我们输入“十三陵”后,除了在搜索结果页面显示相关的文字信息外,在搜索页面右栏还直观地显示出十三陵在地图上的位置、来自维基百科的文字简介、建筑相关信息表(高度、开放时间、设计师等)。页面下方还有与十三陵相关的历史古迹和旅游景点,让用户可以全面了解十三陵。

  再比如我们输入“电脑”这个关键词,谷歌除了在搜索结果页面显示电脑的相关信息,还会在页面右侧显示我们所在城市的各个电脑卖场位置,给用户购买电脑提供方便。

  从用户角度来看,知识图谱的好处显而易见。我们能够直接获得搜索内容的基本信息汇总,而不用根据文字片段和网站名称判断究竟哪个链接最有价值,然后再打开新页面人工过滤页面内的有价值信息。

  知识图谱的演变

  知识图谱是谷歌在2010年收购了开放式数据库公司Metaweb后发展而来的。Metaweb当时主要专注于将不同文字表述与同一个实体连接起来,并探索这些实体的属性(例如明星的年龄)以及彼此之间的联系,最终提供一种新的搜索形式。虽然不能完全替代关键词搜索,但Metaweb的索引、搜索方法在处理诸如“身高160厘米以下的女星”、“乔布斯爱看什么书”之类的搜索时更高效。Metaweb的主要信息来源是 Freebase(一个创作共享类网站,所有内容都由用户添加,采用创意共用许可证,可以自由引用),但谷歌知识图谱的信息来源要宽广得多,不仅包括 Freebase、维基百科等公共资源,也从其他网页搜集整理了大量信息。谷歌目前已经搜集了35 亿条信息。

  知识图谱的搜索效果

  了解了知识图谱的相关知识后,我们再来看知识图谱会带来哪些搜索效果。

  快速过滤出最想要的信息

  当用户输入一个模糊的关键词,这样的一个搜索请求可能会代表多重含义,知识图谱能够理解这其中的差别,并可以将搜索结果范围缩小到用户最想要的那种含义。

  快速查看到最全面的摘要

  有了知识图谱,谷歌可以更好地理解用户搜索的信息并总结出与搜索话题相关的内容,为用户找出更加准确的信息,做出全面的总结并提供更有深度的相关信息。例如,当用户搜索“玛丽·居里”时,不仅可以看到居里夫人的生平信息,还能获得关于其教育背景和科学发现方面的详细介绍。此外,知识图谱还会帮助用户了解事物之间的关系。

  让搜索更有深度和广度

  由于知识图谱构建了一个与搜索结果相关的完整的知识体系,融合了很多学科,把与关键词相关的知识体系系统化地展示给用户。所以用户往往会获得意想不到的发现。在搜索中,用户可能会了解到某个新的事实或新的联系,促使其进行一系列的全新搜索查询。

  总之,传统的机械罗列信息的人工网站迟早会被技术进步所淘汰,谷歌知识图谱提供的简练归纳既会激发用户兴趣,又能为用户提供更便捷、直观、系统的搜索方式。美中不足的是,搜索引擎直接提供最终信息必然引来第三方网站的担忧,那么第三方网站是否会受到影响只能等待时间的检验。

  【责任编辑】赵新宇

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: