一 : Google 网页快照启用新的域名:googleusercontent.com
查看Google网页快照时偶然发现的。Google对网页快照使用了新的域名:googleusercontent.com,我记得以前是用IP的。查了一下whois,信息如下:
以下为引用的内容: Registrant: DNS Admin Google Inc. 1600 Amphitheatre Parkway Mountain View CA 94043 US +1.6502530000 Fax: +1.6506188571 |
又查了一下alexa,排名很高啊,全球的Alexa Traffic Rank排118名,在美国排11名,说明很多人点网页快照的。
又搜了一下英文资料,发现从四月份有些大城市就开始了可以看到这个链接了,那时很多的快照链接还是IP呢,谷歌的快照链接似乎是从五月份开始改的,不过还是不能看到快照内容。
另外,谷歌快照在中国内地经常打不开,解决办法是,把地址换成https就能浏览。
文章来自:http://guao.cc/HQg
感谢读者china 的爆料。
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.google.org.cn](注:本文由编辑整理)
二 : 网页快照
网页快照
求助编辑百科名片

网页快照,英文名叫WebCache,网页缓存。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
编辑本段定义
由于网页快照是存储在搜索引擎服务器中,所以查看网页快照的速度往往比直接访问网页要快。网页快照中,搜索的关键词用亮色显示,用户可以点击呈现亮色的关键词直接找到关键词出现位置,便于快速找到所需信息,提高搜索效率。当搜索的网页被删除或连接失效时,可以使用网页快照来查看这个网页原始的内容。编辑本段原理
释义
为什么我们只要在搜索引擎的搜索框内输入想要查询的关键词,
网页抓取和存储
搜索引擎就会立即在广阔无垠的因特网上,把包含关键词所有网页一网打尽,呈现在我们的面前。如果您了解了搜索引擎的工作原理,就不会这样认为了。每一张网页上都有很多超链接,链接到另外一些网页上,而这些网页上依然有很多超链接,又可以链接到另外一些网页上,搜索引擎的Spider系统通过这样的方式,将互联网上的大量网页逐步抓取下来 搜索引擎中的老大哥Google,它的名字就来自于数学中的1个几乎不可超越的数:googol,这个数是10的100次方,在它的网页数据库中储存了数十亿张网页,这些网页就是通过以上的方式,由NetSpider系统抓取并保存下来的。所有的这些网页,当在搜索引擎结果中进行展示时,都被称为 网页快照。
百度快照示意图
快照抓取
当用户使用搜索引擎在因特网上搜索网页时,那其实就在搜索引擎的网页数据库中搜索,用户误认为搜索引擎一下子就在因特网上找到了包含关键词的网页。 因特网上的网页并不是一成不变的,而是不断增加、删除、改动。因此,搜索引擎网页数据库中的网页也需要及时更新,既把因特网上网页重新复制一遍,如果你在你的网站上删除一张网页,那么搜索引擎数据库中的复制品-网页快照并不会立刻被删除,而是要过一段才会被删除。但是,Google的网页快照是标示快照存档时间的,那么,在这个时间点上,该网页肯定还存在。举例:2008年7月20日打开1个Google的网页快照,而这张快照上显示是Google在7月10日搜索并存档的。什么意思?这表示:2008年7月20日,这个网页或许已被删除或更新,但是,2008年7月10日,当Google对该网页复制存档之际,该网页是确实存在的。搜索引擎和快照
搜索引擎还试图收集一切能够找到的URL,还把包含相同关键词的网页进行排队,纯商业化的搜索引擎采用纯商业原则,还有按点击率给网页排位,这样保证了用户的搜索效率达到最高。 搜索引擎只是1个工具,熟练的驾驶它,可以在因特网中找到十分丰富的资源 目前网页快照最人性化的是“百度”,“百度快照”拥有google快照的全部功能外,还增加的关键字定位功能,为用户提供更加快速、高效关键词搜索方式,在方便程度上来讲“百度快照”大大超越了同类其他搜索引擎。编辑本段作用
互联网上的网页经常发生变化,当被搜索到的网页被删除或死链时,直接点击链接无法查看网页的内容。此时即可使用网页快照来查看这个网页原始的内容。比如你的某网站上发布了一些文章,该网站已经无法再访问,用户即可通过在搜索引擎中搜索该文章的关键词,然后以快照形式进行访问将文章内容进行备份 此外,网页快照可以直接从搜索引擎数据库的储存中调出该网页的存档文件,而不实际连接到网页所在的网站,由于是访问搜索引擎的数据库,这种方式比直接访问所在站点更加安全,可以避免网页内嵌的木马、病毒的威胁;读取网页的速度通常也更快。编辑本段网页快照不更新怎么办?
具备条件
网页快照需要更新,必须具备以下几个前提:网站有新的信息产生; 网站上的这些信[www.61k.com]息能够在最快的时间被蜘蛛爬取到;网站上新的内容得到搜索引擎的认可; 如果我们的网站没有新的内容产生超过1个月,那么很多搜索引擎就会认为这个网站的管理员可能将该网站已经抛弃掉了,所以更新对于SEO来说是后期维护的1个重点内容;经常更新蜘蛛不爬取
如果我们的网站经常更新,但是搜索引擎的蜘蛛却总是不来爬取的话,那么我们需要观察以下是不是我们不让蜘蛛第一时间来爬取我们的网站。我们曾经遇到过有些客户在sitemap.xml里面将首页的爬取频率设置成每周来一次,也就是使用的是weekly,这样的设置即使网站每天不断更新内容,搜索引擎也会遵守sitemap.xml的协议,每周来一次的;还有一些网站蜘蛛不来的原因是因为友情链接上的其他网站的快照更新的比较忙,因为蜘蛛是通过URL来访问网页的,所以那些快照更新慢的网站蜘蛛来一次就会更慢,跟这样的网站交换友情链接无疑是不可能加快蜘蛛爬取的频率的;蜘蛛访问不快照
如果网站经常被蜘蛛访问,我们也经常更新文章,那么我们就要考虑下是不是我们的文章质量得不到认可。因为很多SEO都比较懒惰,所以在文章方面总是希望投机取巧,以为转载过一篇文章修修改改即可欺骗过搜素引擎,可以说新人最喜欢这样,因为会节约很多的时间,岂不知道很多搜索引擎都能够智能的识别那些内容是原创的、那些内容是转载或者说是复制的了,所以建议SEO们还是老老实实的更新内容。我们的建议是将你想转载的内容看一边后,读懂,然后用自己的语言重新把这些意思重复一遍,基本上搜索引擎还是可以认可的。编辑本段影响快照的因素
1、网站内容质量;文章的标题,首尾段必须要做些修改,否则你就算发上去了却不被百度收录有什么用? 2、网站的内容更新频率以及更新的时间段; 快照的更新速度与这个关系是很大的。如果想让网站在百度的快照更新加快就也应该增加网站内容的更新频率。而且应该保持有规律的定时更新,内容至少也要是伪原创。 3、网站的内部结构; 4、网站的权重,内容的权威性。 5、友情链接; 6、外部链接; 外部链接是网站吸引蜘蛛的1个重要手段,经常逛逛论坛,写个博客,只要被搜索引擎收录了,不仅仅得到1个反向链接,而且还有机会吸引到蜘蛛光临,这也是增近百度快照的1个手段。编辑本段解读快照信息
1:从快照时间读出蜘蛛抓取频率
网站快照更新的时间及频率,和搜索引擎抓取网站内容的频率有关系,如果网站的快照更新频率很快,至少可以说明搜索引擎的蜘蛛会经常光临网站。2:快照时间与当前权重
快照更新频繁与否,在反映了咱们之前解读出的蜘蛛抓取频率之外,还反映的着1种趋势。这个趋势说明的就是:按照搜索引擎现行的规则,网站已经得到了蜘蛛的认可。如果在规则不变的情况下,网站还是按照这种趋势来发展,网站的权重会慢慢提高,排名也就会上去了。3:关于快照日期回滚
通常情况下,快照的日期是向着正方向行进的。当然也会有停滞不前或者更新缓慢的,这是由于网站建设或者操作手法上出现了的问题。 但是网站遭遇快照日期回滚就属于比较严重的问题了,这意味这网站本身出现了问题。或许是大量重复内容、或许是网站被挂马之类影响用户体验的情况。这时候咱们必须引起警觉!4:不同关键词搜索出来的快照日期不同
搜索引擎的不同服务器快照时间没有完全同步存在所差异而已。编辑本段网站快照的影响因素
很多人都会遇到网站快照不更新的情况,一般网站快照不更新有以下几点原因:1、网站内容没更新
这种是最基本的了,很多企业站,或者少页面站内容很少,蜘蛛一次来是这个样子,二次来还是这个样子,久了就不来了。搜索引擎快照就会停留在1个时间上。这在以前很普遍。但是通常不大影响排名。2、采集内容过多,网站添加内容重复
采集软件的普及让做网站太简单了,火车头、NICEWORD、爱聚合,各CMS的采集和自助建站功能让很多站长一夜之间成千上万的网页生成,再加上对采集规则的不灵活,伪原创得一塌糊涂,互联网上高度重复的内容太多了。人都看腻了,难道搜索引擎蜘蛛还不吃腻?3、网站标题更改太频繁
很多站长做SEO太心切,做1个关键词,没几天,发现还没上去,赶快换词,改标题,重新描述,结果让蜘蛛无所适从,等等再说咯。4、网站结构改动太大
现在网站买卖比较火,很多站长把买来的站来个大换面,换主题,加版块,甚至改程序。这很容易造就搜索引擎快照回档。5、网站服务器不稳定
网站没备案被服务商停了,搞了几天才好,发现搜索引擎回档了,这还算好的,没K你的站就是万幸;网站被人挂马了,恶意攻击,JS跳转等等,搜索引擎也怕了。6、外链太少
这种情况通常发生在你的站还没有被搜索引擎养成天天来更新习惯,每天虽然都在加内容,但蜘蛛没来吃,所以难更新。7、新站短期内增加外链太多
新站短期增加外链太多也容易快照回档,甚至K站,本身都还在考察期,却来势汹汹,一口气来个成百上千的链接,千万急不得。8、友情链接站关联
友情链接多了,也容易出问题,要经常检查是否有的链接站被K了,快照经常不正常。这样的链接站多了,很容易引起连带反应。天天检查,有问题的赶紧撤了。9、群发过多
群发软件火了,开始用群发软件做链接效果还是蛮不错,可是如今2009年,都群发几年了,搜索引擎也想了些办法了,比较有加有链接的博客文章就是不收录你。一夜之间发万千上万条的先跟你降降权,或者快照回档,或者K站。10、黑链
黑链最近异常迅猛,特别是在网上被那个“高手们”点破之后,越来越多的站长都用上了黑链。可是黑链终究是不光明的,不稳定是最大的特点,晚上加上30站,结果第二天早上一检查看,发现只剩8站。这种不稳定很容易让搜索引擎另眼相看。编辑本段解决网站快照不更新方法
第一点
增加网站的高质量外部链接第二点
每日定期的更新原创高质量内容第三点
首页增加动态版块,比如:最新文章,热门推荐,随机文章等增加首页的活跃性。第四点
交换高质量的友情链接,网站快照最新的网站最合适。[1]三 : 网页快照停滞不前之思索
注册站长网也已经好长时间了,其中针对自己的建站心得也发过几篇软文和大家一起分享过(一个站长成长的辛酸历程 一切从头再来、浅谈搜索引擎的收录及更新规则、浅谈新站被搜索引擎收录技巧等等),不过这次网站快照不更新,特别是4-5月份以来,经常出现大规模快照不更新现象,现根据本人网站(免费之家 http://www.mfzj.net),浅谈网页快照不前的原因:
1、网站有否作弊:一个网站上线后,网页keywords里面关键词堆砌,也会造成搜索引擎降权,导致网页快照不前,一般情况下关键词占整个网页内容的比例应该在2%-7%比较合适。
2、网站是否频繁改动:本人免费之家资源网网站有一阵子经常更改网页模板,因为一个网站上线后,由于审美疲劳,老认为别人的总比自己好,所以造成近2周首页网站快照不前。
3、服务器运营是否稳定:网站被搜索引擎收录以后,当你在规定时间区间内不停更新内容,会造成搜索引擎也会在规定时间内光顾你的站点收录网页。如果在这个时间区域内出现服务器故障或服务器的ip地址其他网站被搜索引擎k掉,也会造成你的网站受牵连而被降权,网站快照一样也会出现停止不前。
4、网站权重是否太低:当网站被搜索引擎定性为权重比较低,那么引擎蜘蛛也会光顾比较慢,造成网站快照长期不更新,唯一的解决方法就是多发些实用原创类的文章,互换相关网站友情链接,网站权重高了,即使内容没有更新,搜索引擎蜘蛛也会常来,网页快照也天天新。
5、友情链接站点是否被k掉:每个网站为了提高权重,会跟自己相同或相似的站点友情链接,如果这些友情链接的站点中出现被搜索引擎K掉的现象,那么你的站点也会出现快照不前。
结论:不管网页快照更新是否,好好管理维护网站,不断更新原创内容,培养搜索引擎的习惯,慢慢它就会对你网页快照经常更新了,所以说要想成为一个成功的网站,网站内容为“王”,流量为“皇”,只有内容为主,流量为辅才能使你的网站越来越辉煌。
站长网首发,转载请注明出处。
四 : 网页快照新发现 书签
最近老是有怪状,有可能是自己修改了一些地方的缘故吧。每次在修改首页的时候就会等两天快照才更新过来,或许是好事或许是坏事,对于SEO的初学者还是不到理解的。
这个博客站点一直在百度上表现卓越,重来没有发生什么错误,不知道这样说了以后就会出现错误。建博以来收录在百度上的页数一直在上升现在有140的收录了,也没有做大量的更新,也只是每天做有频率的更新。现在的成果就是每天有70到80的独立IP或许算不什么。另一方面在GG上表现就不咋的,一般做优化的都是针对GG下手,因为GG比较实在的搜索引擎参与人为机制比较少。而偏偏我的站点收录的页面一直保持在55左右的数据,很是不解,一直更新却没有上升的趋势。不过对于流量的概念也无所谓GG的收录了。后来出于域名指定于是就用了GG管理员工具中的设置首选域名。今天偶然间site了下在GG上居然出现了222条记录就像猛然间发泄一样。还发现的就是一个网页快照的问题,在快照的下面出现了书签的字样。
关于书签的字眼也知道如何解释在SEO的文章中未看到过,也许是自己孤陋寡闻吧,不免对这个现象有点兴趣,看来SEO还有很多神秘的东西去发现。本文由www.frfry.cn站长供稿。
五 : 网页快照你用好了吗
搜索引擎已成为我们网络生活中的一个重要组成部分,而网页快照不仅使我们能更快地访问到搜索出来的网页,而且当我们遇到搜索出来的网页是一些已经删除的网页(如显示“HTTP 404”错误的网页),或是遇到一些暂时关闭的网站,还可以利用网页快照找到所需要的内容。甚至对于我们检索密码和入口都有意想不到的好处,例如在Google中检索“杂志名+password”的时候,经常有一些页面如果直接点连接,提示“404 Not found”之类的错误信息,这时查看Google快照(Cache)往往就能看到该网页原来的内容,甚至会发现许多密码。
掀起你的盖头来—网页快照的原理
简单地讲,“网页快照”就是搜索引擎在收录网页时,都会做一个备份来保存这个网页的主要文字内容,大多是文本的,这个备份是存在搜索引擎的服务器缓存里的,当我们打开网页快照访问时,实际上访问的就是搜索引擎里的这个缓存。所以当这个网页被删除或连接失效时,用户可以使用网页快照来查看这个网页的主要内容,而且又由于这个快照以文本内容为主,因此访问速度比访问一般网页更快。
提示:怎样使用网页快照?
单击搜索结果页面后面的“网页快照”就可以看见该网页的快照内容,对于随时更新的网站(如新闻网站)来说,快照内容不可能跟得上其更新速度,但是对于其他类型或者已经不存在的网站来说,网页快照却是非常有用的,而且网页快照中还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。

天生我材必有用—网页快照的用途
网页快照的用途主要有四个方面:
1.查看无法打开的网页:当你要访问的网页不存在或链接失效或者打开速度极慢时,你可以通过使用网页快照来访问这个网页;
2.查找文字资料:由于网页快照显示的速度比较快,因此如果你要查找一些更新不是很快的文字,比如技术文档、资料等,可以直接通过网页快照来查看,会节省很多时间;
3.快速定位关键字:关键字会单独在网页快照中显示其他的颜色(如红色或者黄色,见下图),因此通过网页快照可以很快找到网页中关键词的位置;

4.查看网页老版本:有时候搜索到的网页可能已经更新了,而你需要的信息是在原来的网页上,这时可以使用快照。
打不开网页快照的解决方案
1.快照打不开的原因
知道了网页快照的原理,我们常常利用它来查找需要的资料,但是使用网页快照时经常会出现打不开的情况,甚至同一时刻有的用户可以打开,而另一个用户却不能使用,这是什么原因呢?一般是由以下三种原因引起的:
①网页文本下载如果排在图片和一些动态文件后,而这些需要先下载的图片或者动态文件却刚好无法下载,则快照可能无法打开;
②若图片或动态文件下载速度慢,会因为超时而打不开快照;
③有些快照中涉及了不良内容,被ISP(如电信)屏蔽了,所以你看不到。
2.解决思路
对于网页快照打不开的前两个原因,是网页本身设计原因造成的,这里我们主要解决第三种情况。ISP出于安全性考虑经常会屏蔽一些字眼和网址,而Google缓存中的一些正常的内容也因此被ISP过滤掉了,导致无法正常打开网页快照。解决问题的根本思路是突破封锁,而ISP采用的方法一般都是对URL地址进行过滤,所以将URL地址修改成符合Google语法格式就可以避开封锁正常浏览了。
3.解决方案
①巧用插件,简单实用
◆GreenBrower/Maxthon两种浏览器的插件。
将解压后的所有文件复制到C:ProgramGreen Borwerplugin
GoogleCache目录下面,启动Green Browser,单击菜单栏中“工具/扩展工具栏”,选择“设置扩展工具栏”,单击“命令”
后的“...”按钮中选择该插件(见下图),再单击“插入”按钮增加该插件,选中该插件前的复选框。如果需要自动运行此插件,则勾选“工具”菜单的“扩展工具栏”的“自动运行所选插件”。

插件安装完成后,如果设定了自动运行,那么插件将在后台开始自动工作了。如果是设定的手动运行,在需要打开快照的页面上和已经打开失败的快照页面上单击工具栏中的“G”按钮后,打开Google搜索结果页面,单击“网页快照”链接查看即可。有时,我们在刷新页面后,会发现安装的插件没起作用,这时在单击“网页快照”链接前,将鼠标悬停在“网页快照”链接上,看浏览器的状态栏显示的链接地址中是否包含有“search?&q=cache:”,尤其是“&”,如果没有则需要再次手动运行插件。
提示:如果是使用Maxthon浏览器,将文件解压至Maxthon程序目录下的pluginGoogleCache目录,退出并重新启动Maxthon,程序自动提示有新的插件,单击“确认”即可。
特别需要注意的是:在打开的页面快照上面的Google框架中有一个“缓存文本”或“cached
text”,不要单击,否则可能会出现页面加载完毕后链接地址被错误修正,无法显示的情况;或者在页面没有加载完毕前点击或刷新后单击,此时链接地址没有修正,导致IP屏蔽,而无法访问页面快照。
提示:其实Google搜索提供了一个最简单的命令,可以完成快照的搜索。当网址不能打开时,可以在Google首页的搜索框中输入“cache:www.pcdigest.com”,回车后就可以打开该页面的快照了。
◆Firefox浏览器的插件。
工具谱
软件名称:GoogleCache(GreenBrower/Maxthon下用)
软件版本:N/A
授权方式:免费软件
软件大小:2.33KB
下载地址:http://searchsmallbizit.techtarget.com.cn/imagelist/05/08/t4ifn0l2q0oh.rar
下载相关插件,解压后是googlecache.xpi文件。
启动Firefox,单击菜单栏上“工具/扩展”打开扩展窗口,把googlecache.xpi文件用鼠标拖入到扩展窗口中,会自动弹出一个安装对话框(下图),单击“立即安装”,插件即开始安装,然后重启Firefox。 工具谱
软件名称:GoogleCache(Firefox)
软件版本:N/A
授权方式:免费软件
软件大小:2.85KB
下载地址:http://mygoogle.kmip.net/gznm/050901/firefoxcache.rar
在Firefox地址栏输入“about:config”,这时工具栏上会多一个过滤器(英文版是Filter)。在其中输入“search”,网页页面中会自动出现“browser.search.defaulturl”,后面的值是“http://www.google.com/search?lr=...”(见下图),右键单击选择Modify(修改),把http://www.google.com/改为下面的Google的其他数据中心的地址即可,如http://64.233.167.104/,以后在搜索时查看Google网页快照就不需要使用代理了。

②有效代理,突破封锁
寻找代理服务器是突破ISP封锁的最简单方法,下载一个代理服务器搜索工具(如“代理猎手”ProxyHunter等),根据工具再找一个有效的代理,通过代理访问快照网页,突破ISP的封锁。
③修改域名,转向访问
使用www.google.com访问快照经常会被过滤,这时我们可以将搜索的域名地址进行修改,例如改为http://www.google.com/u/berkeley或http://www.google.com/custom。这样就能有效地解决快照访问的问题了。Google的网址还可修改为:http://google.7766.org、http://64.233.167.104/等。
提示:Google的其他数据中心的地址还有:http://66.249.81.99/、http://66.102.7.104/、http://64.233.161.104/、http://64.233.161.104/。
附录:关于网页快照的其他一些说明
1 哪些网页是看不到快照的?
答:未编入索引的网页是没有快照的,或者应网页主人要求,删除了快照,这样也是没有快照的;
2 网页快照多久更新一次?
答:多久更新一次可不好说,这要根据各搜索引擎程序的爬行程序来定,但我想不会也没必要太频繁;
3 为什么有些快照会无法打开?
答:快照只保存了网页的HTML部分,并不保存网页的全部内容。打不开快照可分为三种情况:
1)网页文本下载如果规定在图片和一些动态文件后,而这些需要先下载的文件刚好无法下载,则快照可能无法打开。
2)若图片或动态文件下载速度慢,会因为超时而打不开快照。
3)有些快照中涉及了违法内容,所以不会让你看到。
4 为什么有些快照打开了却看不到内容?
答:快照会对网页内容进行过滤,可能不会显示音乐,图片文件,也许你碰到了图片比较多的网站哦,如果网页本身就只是由一个动态文件(或一些java特效)或FRAME构成,则快照即使打开,也有可能什么都看不到。
5 为什么有时候点了一个快照却连到了其他的网页?
答:如果网页的源代码中有重定向命令,则快照可能会直接连到指定的网页。
6 为什么快照中会出现乱码?
答:这个分为五种情况:
1)网页指定了错误的编码。
2)浏览器不支持该网页使用的语言。
3)浏览器错认了该网页的语言编码。
4)搜索引擎对文字编码错误。
5)搜索引擎未能正确识别和显示字符。