说下一代语义学搜索前,要知道上一代语义学搜索是什么。说上一代语义学搜索前,要知道 KDE 下的语义学搜索的结构是怎样的。那就让苏在升级 KDE 4.13 的垃圾时间里为大家灌输一些「无用的知识」吧!KDE 的语义学搜索是这样组织的:strigi 是一个文件内容搜索引擎,它从用户的文件中提取出语义学数据,然后把语义学数据灌给 nepomuk。nepomuk 是 KDE 下访问语义学数据的函数库,使用 soprano 来存储这些语义学数据。soprano 是一个访问语义学存储(RDF)的 Qt 库,就跟 Qtsql 一样,它有三种后端:redland、seasame2 和 virtuoso。之前记得我说过 KDE 下的卡机三架马车就是 strigi、nepomuk 和 virtuoso。之所以会产生这样的结果,是因为:strigi 在索引文件的时候非常之吃 CPU; 然后 virtuoso 呢,soprano 一共三种后端:redland 是 c++ 写的,但它的检索速度非常之慢,满足不了 nepomuk 的要求;seasame2 是 java 写的,不可能 C++/Qt 的 KDE 的「非常重要」(官方是这么看的,我不这么看,我一般语义搜索都不用)的功能去依赖 java; 于是 KDE 领衔开发了一个据说是「c++ 写的,检索速度达到 seasame2 同等甚至更高的水平」的 vir
...
继续阅读
(61)