垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸。它将网页库中某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理,然后再以某种形式返回给用户。
垂直搜索引擎与普通网页搜索引擎的最大区别是对网页信息进行了结构化抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引,再以搜索的方式满足用户的需求。可以这样说,网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。
各大搜索引擎都有自身的垂直搜索功能,比如MP3搜索、图片搜索、新闻搜索、Blog搜索等。独立的垂直搜索网站也受到有相关兴趣的用户的青睐,比如旅游搜索引擎、商业搜索引擎、比价搜索引擎等。(http://www.nbseo.cc/archives/1612)
