搜索引擎结果聚类系统 —apex搜索
写于 2005年08月03日 20:16 评论(1)
(via http://www.dmresearch.net/)apex搜索聚类系统是一个对搜索结果进行聚类的工具,集成了目前先进的聚类技术以及中文信息处理相关技术。该系统基本原理是对用户的查询结果进行聚类,并将聚类结果呈现给用户,提供给用户一个简单明了的用户界面。
目前,检索结果聚类系统包括两个版本:
- PC用户版本: http://apex.sjtu.edu.cn:50183
- 智能手机用户版本: http://apex.sjtu.edu.cn:50183/smart.aspx
我觉得这里有些问题:首先速度问题需要解决;再就是实用性问题,对一个搜索引擎结果进行优化大家是否愿意使用?可以考虑从几个搜索引擎中抽取结果再进行聚类我觉得意义更大些。
同意shijun的观点。另外同样是在教育网内,系统速度还是非常的快。另外我对这个分词技术也挺感兴趣的,apex是自己研发的?
在中文领域,Google的中文分词技术采用的是美国一家名叫Basis Technology(http://www.basistech.com)的公司提供的中文分词技术,百度使用的是自己公司开发的分词技术,中搜使用的是国内海量科技(http://www.hylanda.com)提供的分词技术。对于中国本土来说,由于文化背景等因素,比如人名、拼音,百度、中搜应该比google更具有优势。
Warm Regards,
J.
J.
原文地址:http://www.junchenwu.com/2005/08/_apex.html
评论(1)
beikoo.com 聚类搜索