免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1761 | 回复: 0
打印 上一主题 下一主题

google 搜索技巧 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-05 20:41 |只看该作者 |倒序浏览
参考资料
http://www.se-express.com/article/article13.htm
http://www.williamlong.info/archives/728.html
Google简介
Google(
www.Google.com
) 是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,Google已经获得30多项业界大奖。到Google的新闻中心(http: //www.Google.com/press/index.html),你可以找到关于一切关于Google的历史和新闻资料。
Google的成功得益于其强大的功能和独到的特点:
Google检索网页数量达24亿,搜索引擎中排名第一;
Google支持多达132种语言,包括简体中文和繁体中文;
Google网站只提供搜索引擎功能,没有花里胡哨的累赘;
Google速度极快,年初时据说有15000多台服务器,200多条T3级宽带;
Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;
Google智能化的“手气不错”功能,提供可能最符合要求的网站;
Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。
Google具有独到的图片搜索功能;
Google具有强大的新闻组搜索功能;
Google具有二进制文件搜索功能(PDF,DOC,SWF等);
Google还有很多尚在开发阶段的令人吃惊的设想和功能。
等等

更多信息,参见:
http://www.google.com/intl/zh-CN/options/
,这里有很多项目,需要自己去琢磨。
搜索入门
基本搜索
Google 查询简洁方便,仅需输入查询内容并敲一下回车键 (Enter),或单击“Google 搜索”按钮即可得到相关资料。

Google 查询严谨细致,能帮助您找到最重要、最相关的内容。例如,当 Google 对网页进行分析时,它也会考虑与该网页链接的其它网页上的相关内容。Google 还会先列出那些搜索关键词相距较近的网页。

Google允许一次搜索最多32个关键词
Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。如下,注意中间要有空格的。
搜索引擎 历史 -文化 -中国历史 -世界历史
自动使用“and”进行查询

Google 只会返回那些符合您的全部查询条件的网页。不需要在关键词之间加上“and”或“+”。如果您想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。

忽略词

Google 会忽略最常用的词和字符,这些词和字符称为忽略词。Google 自动忽略“http”, “.com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。

使用英文双引号可将这些忽略词强加于搜索项,例如:输入“柳堡的故事”时,加上英文双引号会使“的”强加于搜索项中。

双引号可以用减号代替,比如搜索["like this"]与搜索[like-this]是一个效果

根据上下文确定要查看的网页

每个 Google 搜索结果都包含从该网页中抽出的一段摘要,这些摘要提供了搜索关键词在网页中的上下文。
简繁转换

Google运用智能型汉字简繁自动转换系统,为您找到更多相关信息。

这个系统不是简单的字符变换,而是简体和繁体文本之间的“翻译”转换。例如简体的“计算机”会对应于繁体的“电脑”。当您搜索所有中文网页时,Google会对搜索项进行简繁转换后,同时检索简体和繁体网页。并将搜索结果的标题和摘要转换成和搜索项的同一文本,便您阅读。
词干法

Google 现在使用“词干法”。也就是说,在合适的情况下,Google会同时搜索关键词和与关键词相近的字词。词干法对英文搜索尤其有效。例如:搜索“dietary needs”, Google会同时搜索“diet needs”和其它该词的变种。用于搜索的您原来用词的任何变化都将在搜索结果的简述文字中标示出来。

英文字母大小写是否有影响?

Google 搜索不区分英文字母大小写。所有的字母均当做小写处理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的结果都一样。
拼音汉字转换

Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示。例如:搜索“shang wu tong”, Google 能自动提示 “您是不是要找:商务通”。如果您点击“商务通”, Google 将以“商务通”作为关键词进行搜索。对于拼音和中文混和关键词, 系统也能做有效转换。对于拼音“lü”, “lüe”, “nü” 或 “nüe”,您可输入 “lv”, “lve”, “nv” 或 “nve”。如果拼音中没有空格,例如 “shangwutong”,Google 也会做相应处理,但是在多个拼音中加空格能提高转换准确率和速度。

由于汉语的多音字和方言众多,常用发音与实际发音常常有出入,更不用说拼音输入中可能出现的错误了。Google 的拼音汉字转换系统能支持模糊拼音搜索,为用户提示最符合的中文关键词,具有容错和改正的功能。例如:搜索 “wan luo xing wen”, Google 会提示 “您是不是要找:万罗兴文 万络行文 网络新闻”, 其中 “网(wang)络新(xin)闻” 是系统参考了可能会有的拼音错误后自动转换的。点击其中任一提示,Google 将以其作为关键词进行搜索。
高级技巧
       有很多的操作符。一些操作符使用符号来代替单词。比如OR, "",-,+,参见基本搜索技巧。

改变查询类型的操作符
Cache
       寻找较早前cache的网页 比如:cache:www.google.com web 也可以在搜索结果中点击“网页快照”

Link
       寻找那些网页连接到这个网站    link:oychw.cublog.cn (最新的Google Blog Search也支持这个语法),但是Google并不会给出所有的包含此链接的网页,因为它要保证pagerank算法不被反向工程(呵呵,可以参见那两个Google创始人关于pagerank的论文,可下载)

Related
类似网页,related:www.google.com   也可以在搜索结果中点击“类似网页”

info
       查看网站介绍信息。    info:oychw.cublog.cn

其他信息的操作符
Define
       搜索[define:css]相当于搜索css的定义

Stocks
       搜索股票,比如:stocks:600231,stocks: intc


查询条件操作符
site
       在指定网站或域名中查询    help site:www.google.com          211 site:edu.cn

allintitle
       标题中必须包含所有关键字 allintitle:雪峰 磁针石
Intitle
       第一个关键字必须在标题中,其他的可以在标题或者内容中。intitle:雪峰 磁针石
[intitle:google intitle:search] 和s [allintitle: google search]效果相同

Allinurl
         url中必须包含所有关键字,不过
allinurl: google search
inurl
       类似于intitle
filetype
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、. ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档 (Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前 Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一 般比较集中全面。
示例:搜索几个资产负债表的Office文档。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”
结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。
注意,下载的Office文件可能含有宏病毒,谨慎操作。
示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档
搜索:“"search engine" tips OR tutorial filetype:pdf”
结果:已向英特网搜索"search engine" tips OR tutorial filetype:pdf. 共约有12,600项查询结果,这是第1-10项 。 搜索用时0.22秒。
我们来看其中的一个结果:
[PDF]Search Engines Tips
文档类型: PDF/Adobe Acrobat - HTML 版
... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com
* Search Engine Watch http://searchenginewatch.com/ Some free tips ...
www.allvertical.com/PromoKits/SearchEngineTips.pdf - 类似网页
可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片。

目录检索
如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录“http: //directory.Google.com/”,中文目录是“http: //directory.Google.com/Top/World/Chinese_Simplified/”。分类的网站目录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所需要的信息能否在一个专门主题的网站上找到。不过需要说明的是,用目录检索,往往需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览也就无从谈及了。

目前Google使用的分类目录采用了ODP的内容。“Open Directory Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。另外,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。

示例:查找一下介绍搜索引擎方面的中文网站
搜索:先进入中文简体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,再进入“搜寻”子目录。我们看到在“World > Chinese Simplified > 计算机 > 互联网络 > 搜寻”下,还有两个子目录“分类目录 (33) 搜索引擎 (10)”,以及6个相关网站。显然,这些都是我们所需要的信息。

除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。
结果:在分类Google 网页目录项中搜索搜索引擎。 共约有387项查询结果,这是第11-20项 。 搜索用时0.09秒。

可以看到,上述查询结果比普通的检索更有效,因为在分类“互联网络”下进行搜索剔除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。但愿这个问题能随着Google以及ODP项目在国内名声的响亮而能得到改观。

其他技巧
在单词前加~符号可以搜索同义词,比如你想搜索[house],同时也想找[home],你就可以搜索[~house]
Google可以指定数字范围搜索。搜索[2001..2005]相当于搜索含有2001、2002直到2005的任意一个数的网页
Google有一定的人工智能,可以识别一些简单的短语如[when was Einstein born?]或[einstein birthday]
在Google 中输入一组关键词时,默认是“与”搜索,就是搜索包含有所有关键词的网页。如果要“或”搜索,可以使用大写的[OR]或 [|],使用时要与关键词之间留有空格。比如搜索关键词[Hamlet (pizza | coke)],是让Google搜索页面中或页面链接描述中含有Hamlet,并含有pizza与coke两个关键词中任意一个的网页。
你可以在搜索时使用通配符
  • ,这在搜索诗词时特别有效。比如你可以搜一下["love you twice as much * oh love * *"] 试试。“*”代表一连串字符,“?”代表单个字符
    如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。比如:+www +。



    利用google突破各种封锁来下载你要的东西...抄下来了

    第一篇
    在搜索框上输入: “index of/ ”  inurl:lib

    再按搜索你将进入许多图书馆,并且一定能下载自己喜欢的书籍。

    在搜索框上输入: “index of /”  cnki

    再按搜索你就可以找到许多图书馆的CNKI、VIP、超星等入口!

    在搜索框上输入: “index of /”  ppt

    再按搜索你就可以突破网站入口下载powerpint作品!

    在搜索框上输入: “index of /”  mp3

    再按搜索你就可以突破网站入口下载mp3、rm等影视作品!

    在搜索框上输入: “index of /”  swf

    再按搜索你就可以突破网站入口下载flash作品!

    在搜索框上输入: “index of /”  要下载的软件名

    再按搜索你就可以突破网站入口下载软件!

    注意引号应是英文的!

    再透露一下,如果你输入:

    “index of /”  AVI

    另补上第二篇
    用GOOgle看世界!!!只要你在GOOGLE里输入特殊的关键字,就可以搜到数千个摄象头的IP地址!通过他你就可以看到其所摄的实时影象!!
    在google里输入
    inurl:"viewerframe?mode="

    随便打开一个,然后按提示装一个插件,就可以看到了!!!

    再补上第三篇
    三则黑客的Google搜索技巧简介
    大家都知道,Google毫无疑问是当今世界上最强大的搜索引擎。然而,在黑客手中,它也是一个秘密武器,它能搜索到一些你意想不到的信息。赛迪编者把他们进行了简单的总结不是希望您利用他去攻击别人的网站,而是利用这些技巧去在浩如烟海的网络信息中,来个大海捞针,寻找到对您有用的信息。

    如果您是一名普通网民,您可以使用黑客的技巧扩大自己的视野,提高自己的检索效率;如果您是一名网管,请您赶快看看您的网站是否做好了对下面黑客探测手段的防范措施,如果没有就赶快来个亡羊补牢,毕竟隐患胜于明火,防范胜于救灾;如果您是一名黑客,相信您早以在别的黑客站点上见过类似的方法,这篇文章对您没什么用处,这里的技巧对您是小儿科,菜鸟级!您可以节省宝贵的时间做更有意义的事情,这篇文章您不用看了,到别处去吧!

    基于上面的考虑我编发了这篇文章。

      搜索URL

      比如我们提交这种形式:passwd.txt site:virtualave.net

      看到了什么?是不是觉得太不可思议了!有很多基于CGI/PHP/ASP 类型的留言板存在这种问题。有时我们得到密码甚至还是明码的!管理员或许太不负责了,或许安全防范的意识太差了,如果你是网络管理员,赶快检查一下不要让恶意攻击者捡了便宜。不要太相信DES加密,即使我们的密码经过DES 加密的密码,黑客们还是可以通过许多破解软件来搞定。

      



      这次我们能得到包含密码的文件。“site:virtualave.net”意思是只搜索 virutalave.net 的URL。virutalave.net是一个网络服务器提供商。

      同样,我们可以搜索一些顶级域名,比如:.net .org .jp .in .gr

      config.txt site:.jp

      admin.txt site:.tw

      搜索首页的目录

      首页是非常有用的,它会提供给你许多有用的信息。

      我们提交如下的形式:

      "Index of /admin"

      "Index of /secret"

      "Index of /cgi-bin" site:.edu

      你可以自己定义搜索的首页字符。这样就可以获得许多信息。

      搜索特定的文件类型

      比如你想指定一种文件的类型,可以提交如下形式:

      filetype:.doc site:.mil classified

      这个就是搜索军方的资料,你可以自定义搜索。


    本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/22182/showart_727432.html
  • 您需要登录后才可以回帖 登录 | 注册

    本版积分规则 发表回复

      

    北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
    未成年举报专区
    中国互联网协会会员  联系我们:huangweiwei@itpub.net
    感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

    清除 Cookies - ChinaUnix - Archiver - WAP - TOP