近日富士施乐研究人员表示,已开发出一款文本挖掘工具。该工具更符合人们思考、说话、提问题的方式。
在FactSpotter工具中输入“what Steve Jobs said yesterday”,它就会在文档中进行搜索,返回相关的答案,而不是挑选出无数包含有苹果CEO名字的文章。
但是,FactSpotter软件不会通过互联网或其它途径提供给用户,而只有富士施乐客户才能够使用。
富士施乐营销、战略、联盟部门总经理兼主管吉恩向Silicon.com表示,富士施乐不会将FactSpotter作为独立应用软件销售,只会作为一款嵌入式软件销售给其客户。
吉恩说,我们不会利用它挑战Google,它只是一种选择,我们需要这一技术形成自己的特色。
富士施乐技术经理贾马斯表示,FactSpotter与Google搜索完全不同,因为我们能获得一定水平的细节资料。
FactSpotter工具首先提供给有大量文档的诉讼市场。富士施乐预测它将被应用于必须从巨型数据库中访问信息的其它领域,其中包括企业和政府搜索、药物发现、欺诈探测、风险管理。
富士施乐实验室经理克里斯托弗向Silicon.com表示,FactSpotter还可以用于管理并购交易期间产生的大量文档。FactSpotter能够以每秒2000份文档的速度处理文档。克里斯托弗说,下一步开发的重点是提高FactSpotter的速度。
FactSpotter利用一个语言引擎对单词和语句进行分析,搞清楚用户的确切意义。FactSpotter还能够识别搜索关键字中的概念。
例如,在前面的例子中,当用户输入“what Steve Jobs said yesterday”时,FactSpotter能够对它进行解析,将“Steve Jobs”识别为人名,将“yesterday”识别为时间。
富士施乐研究人员表示,已开发出一款文本挖掘工具。该工具更符合人们思考、说话、提问题的方式。负责语义技术研究的经理萨冈德说,富士施乐试图使计算机能够象人那样理解文本。
萨冈德表示,FactSpotter是搜索文档的下一步,使用了Web 3.0技术。
|