Proudly Powered by WordPress and FireFox
31 Jul
早在MSRA的一次巡回讲座——计算的下一个十年中就听说了微软的关系搜索。到今天,终于见到庐山真面目了。

以下是微软对于“人立方”的定义(呃,取人立方这个名字很明显是赶了奥运的潮):
人立方关系搜索从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并且通过算法自动的计算出它们之间存在关系的可能性;同时,人立方关系搜索还索引了支持它们之间关系的网页文字。此外,人立方关系搜索还自动的找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品等词条等。人立方关系搜索从这些中文网页中自动的辨别出人名所对应的人物简介文字,并且按照这些文字是人物简介的可能性进行排序。
当用户给定任意搜索关键词,它能够找出与关键词最可能相关的人名、地名和机构名,并且根据它们与关键词之间的相关度排序。除此之外,人立方关系搜索还提供基于人名的新闻浏览功能,可视化关系搜索功能等。
两种搜索结果呈现方式
搜索一个关键字后,会有文字和图形两种方式来呈现结果,文字结果不消多说,我们来看一下图形的结果吧:

如果是搜“姚明”之类的公众人物,那么返回的结果还是有点意思的(看,姚明和李宇春的关系)。
但是,比如搜我自己这样不公众的人名,返回的结果就很离谱了,这也不怪MSRA,因为网上关于我的可以挖掘的数据太少。
试用感想:很炫,暂时还不够实用。目前最好的利用大概就是满足那些对明星八卦很敏感的人的需求了。
标签: 人立方, 关系搜索, 微软
Leave a reply