搜索引擎的出现,整合了互联网上众多的网页资源,并提供信息导航和信息查询服务,使信息的价值得到了网民和厂商的普遍认可。但随着市场需求的多元化,搜索引擎出现了行业化和细分化,更加专业、更有针对性的搜索引擎——“垂直搜索引擎”成为了搜索引擎发展的必然趋势之一。
一、TRS垂直搜索的基本情况
垂直搜索引擎是针对某一行业或组织,满足行业专业需求、或者组织某项业务需求的专业搜索引擎,是搜索引擎的细分和延伸及对某类网页资源和结构化资源的深度整合,它能提供符合专业用户操作行为的信息服务方式。
TRS垂直搜索技术是搭建智能化、个性化特色的新型搜索引擎的平台,它能够通过模板技术准确的采集网页元数据;通过TRS 文本挖掘的自动排重、自动分类、信息抽取等智能化技术对信息进行加工;借助TRS 全文数据库系统实现结构化和非结构化数据的统一存储和检索。TRS垂直搜索引擎的特点是“专、精、深”,且具有行业色彩,相比通用搜索引擎的海量信息无序化,TRS垂直搜索引擎则显得更加专注、具体和深入。
现今,垂直搜索引擎在政府、企业、行业门户、生活相关领域都有良好的应用效果,备受用户欢迎。
二、TRS垂直搜索的典型应用
专业化的行业搜索引擎—“宏源股搜”
“宏源股搜”,是应用TRS垂直搜索引擎技术在其新网站系统上建设的国内第一家证券行业搜索引擎,它通过对证券类网页资源和结构化资源进行深度整合,为网民提供服务。系统采用TRS全文数据库系统(TRS Database Server)、TRS文本挖掘软件(TRS CKM)和TRS内容分发服务器(TRS CDS)等先进产品建立,并通过对宏源证券公司内部和外购的各类证券投资资讯数据库进行整合和搜索,来获取和精选关于股票股情综合信息,为网站注册用户和宏源证券公司客户提供更有价值的个性化信息服务。宏源证券投资垂直搜索系统在满足用户需求的基础上,还可以继续进行内容加工和二次信息销售等工作,为证券公司带来可观的效益,走出一条区别于其他证券商的差异化服务之路。宏源证券投资垂直搜索引擎是基于文本智能处理和展现的技术,它在国内证券行业首次应用,具有很强的行业领先效应。同时,基于免费开放的搜索服务,将急剧提升宏源证券的网站人气、聚集访问量,为宏源证券带来大量的潜在客户。
精准的跨平台海量数据检索引擎—“中数新搜”
中国数码四家网站(1大把、财讯、黑泡网、DNAQ)上现有数据(网页)约700万条,并按每日新增数据约3000~5000条的速度增长。为了给用户提供更好的搜索服务,中国数码决定对4家门户网站内的信息进行整合,并共用统一的检索服务系统。由于四家网站的信息量巨大、用户检索并发请求数量多,中国数码决定采用在国内外均处于领先地位、在千万级记录的数据库上,能获得亚秒级查询速度的TRS全文数据库做负载均衡集群系统(TRS Database Server),对海量信息进行快速搜索。
新搜索系统的应用,把N次检索变成了一次检索,使网民只要输入搜索需求,就能把四家网站上的所有相关信息都搜索出来,解决了网民需要的统一检索问题,节省了网民的查询时间,提升了网站的点击率。从前网民查询同一主题的内容,需要分别登录各个平台检索一次,繁琐且复杂,新搜索系统建立后只需检索一次,就能把更全和更准的信息反馈给网民。另外,新搜索系统的应用,也保证了四家网站上的用户信息能够第一时间被网民搜索到,从而提升了用户和四家网站的经济效益。
深度化的行业搜索引擎—新华网搜
采用TRS全文数据库系统(TRS Database Server)等技术建造的新华网新闻搜索系统充分整合了新华网,中央重点新闻网站、地方重点新闻网站及其它重要媒体网站的新闻信息资源,构建出一个面向新闻信息资源的多站点、多语种、多媒体的搜索应用平台;提供快速、准确、实用的站内外新闻搜索及相关应用服务,极大的满足广大网民和新华网编辑的使用需求。更重要的是新的新华网新闻搜索系统满足了新华网今后几年的发展需求,并能够根据新华网业务发展的需要方便地进行扩展,为新华网搜索应用创新提供了良好的基础平台。
三、从搜索引擎技术发展趋势看搜索服务的细分
搜索引擎经过几年的发展和摸索,越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展,其开发重点也放在对检索结果的处理上,以期为用户提供更优化的检索结果。
纯净搜索引擎
这类搜索引擎没有自己的信息采集系统,利用别人现有的索引数据库,主要关注检索的理念、技术和机制等。
元搜索引擎
元搜索引擎(metasearch enging)是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler、dopile、ixquick等。
集成搜索引擎
集成搜索引擎( All-in-One Search Page),亦称为“多引擎同步检索系统 ”(如百度http://www.baidu.com)是在一个WWW页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便。
垂直搜索引擎
(略)
结语:随着搜索引擎市场的发展,用户对搜索引擎的功能和其搜索内容的体现将会有更高的需求,希望搜索引擎能够为其提供更加专业的细致的信息服务。在这个过程中,垂直搜索正逐渐被用户认知并使用,而传统的综合型搜索引擎受到用户需求和新进竞争对手的压力推动,也开始增加服务的细分性和层级性,以加强对用户的吸引。
来源: