JunChen::Wish Room 1906

Promoting Usability, Accessibility and Web Standards...

上一篇:digg,ACSI与文章价值 | 返回首页 | 下一篇:关于文章的价值

搜索引擎结果聚类系统 —apex搜索

发表于 2005年08月03日 08:16 PM @ 分类:

(via http://www.dmresearch.net/apex搜索聚类系统是一个对搜索结果进行聚类的工具,集成了目前先进的聚类技术以及中文信息处理相关技术。该系统基本原理是对用户的查询结果进行聚类,并将聚类结果呈现给用户,提供给用户一个简单明了的用户界面。

目前,检索结果聚类系统包括两个版本:

  • PC用户版本: http://apex.sjtu.edu.cn:50183
  • 智能手机用户版本: http://apex.sjtu.edu.cn:50183/smart.aspx

shijun在他的Blog里说道

我觉得这里有些问题:首先速度问题需要解决;再就是实用性问题,对一个搜索引擎结果进行优化大家是否愿意使用?可以考虑从几个搜索引擎中抽取结果再进行聚类我觉得意义更大些。

同意shijun的观点。另外同样是在教育网内,系统速度还是非常的快。另外我对这个分词技术也挺感兴趣的,apex是自己研发的?

在中文领域,Google的中文分词技术采用的是美国一家名叫Basis Technology(http://www.basistech.com)的公司提供的中文分词技术,百度使用的是自己公司开发的分词技术,中搜使用的是国内海量科技(http://www.hylanda.com)提供的分词技术。对于中国本土来说,由于文化背景等因素,比如人名、拼音,百度、中搜应该比google更具有优势。

相关文章

引用 Trackback

本文引用地址:http://www.junchenwu.com/cgi-bin/mt-tb.cgi/40.

评论

names 说:

beikoo.com 聚类搜索

发表评论