搜索引擎的站内搜索应用详解
的有关信息介绍如下:百度和谷歌等搜索引擎默认进行的是网页搜索,大部分网友只懂得用网页搜索。网页搜索结果往往异常丰富,很多时候需要应用搜索引擎的高级搜索,进行精确搜索,站内搜索就可以派上用场了。
搜索引擎很多,鉴于百度和google的在中国的影响力与用户数量,本文以百度和谷歌为例进行讲解。
先简单介绍站内搜索语法,以百度为例,如下图1所示,在百度搜索帮助中心找到高级搜索语法,即可查看站内搜索说明。谷歌的站内搜索语法跟百度是一样的,这里不再解释。
.com等商业广泛应用的顶级域名,对应的网页数量最庞大,搜索出来的内容异常庞杂,一般难以达到精确搜索的目的,例如下图2所示。
如果已经确定了搜索信息来自特定的非通用商业域名的网站,例如教育网的edu,政府网的gov等,则可以用顶级域名来进行搜索。例如下图3所示,要搜索香港高校的ftp,由于香港的大学网站是edu.hk为域名,则可以直接在顶级域名为edu.hk的网站里搜索,这样搜索结果就比较精确了。这样搜索,我们无需知道各个相关高校的网站。
一些la、tk、cc等不常见域名的网站,这些域名主要是一些国别和地区顶级域名。某些信息反倒可能在这些网站上,因而,也可以适当运用这些顶级域名进行站内搜索,例如下图4所示。
一些网友就是学会了站内搜索,也只是把它用在网页搜索里,例如下图5所示。
其实,站内搜索可以用到视频搜索、图片搜索等专业搜索(垂直搜索)上,例如下图6所示的谷歌图片搜索。
下图7所示,是站内搜索在谷歌视频搜索中的实例演示。有了站内搜索,就免去在各个视频网站之间切换查找视频的麻烦啦。
既然能把搜索内容局限于某些网站,那反过来,是否可以把来自某些网站的搜索结果去掉呢?这个真的有,例如下图8所示。再对比下图9,就可以发现百度百科的结果木有啦,来自百度的结果其实都统统排除啦。
图8中的搜索表达式中的减号,是布尔运算里的逻辑非运算符,要用半角符号来输入,运算符前带一空格,后不带空格。
如果希望搜索结果来自多个网站,则可以用如下图10所示的方法,使用多个站内搜索表达式。
注意,多个站内搜索表达式要用半角符号的括号括起来;表达式之间的竖杠是布尔运算的或逻辑运算符,运算符前后要带一空格。
而对于谷歌,站内搜索的或运算,除了可以用“远征军 (site:163.com | site:sina.com.cn)”这样的形式,还可以用OR作为或运算符,如下图11和12所示。
而对于百度,则只能使用竖杠作为或运算符,不能使用OR,例如下图13所示。
而对于谷歌来说,用字母做或运算符,则字母必须要大写,不能小写,否则就会出现下图14所示的结果了,什么都搜不到。
如果要在搜索结果里排除来自多个网站的结果,则可以用下图15所示的方法。
我们知道,大多数网站都是设有多个频道和栏目的,而不同的频道栏目对应着不同的二级甚至三四级以上的域名。有时候,需要查找来自某个网站的信息,但不需要来自该网站的某些频道或是栏目的信息,那我们可以用例如下图16所示的方法来实现。
为搜索来自某些网站的可供下载的文件,还可以使用例如下图17所示的方法,混合文件搜索和站内搜索。
如果我们要知道某些网站里都有哪些文章的标题使用了某个关键词,则可以用下图18所示的方法,用标题搜索混合站内搜索。
基本的应用,本文已经演示讲解了,大家在实际使用中只要会综合运用即可。