从google快照获取seo信息-通过google快照的文本模式诊断google机器人的爬行
在纯文字谷歌的快照版本提供了谷歌是否是正确的获取您网页的文字内容的线索。您可以通过点击“纯文字版本”来进入这个快照(见下面的截图)。如果在正常浏览,您可以看到您的文本,但如果您无法在文本模式中看到,则表示Googlebot无法看到您的网页上的文本。这可能是JavaScript的驱动或用Adobe Flash来显示的,效果都一样,总之,Googlebot不能正确地索引您的网站的文本内容。
事实上,纯文字谷歌的快照版本,提供的结果是非常相似的结果lynx text浏览器。这是有道理的,因为谷歌也承认,它Googlebot和该浏览器的行为很相似。

seo-google
建议:
1。如果您不能确定您的网站上的一些超级链接是不是可以抓去,请查看谷歌的快照的纯文字版本,以检查您是否可以看到这些链接,它们是否可以点击。

2。在纯文字版本可用于诊断一些网站的隐藏文字,JavaScript的伪装和基于flash的内容。如果被Googlebot看到的内容和正常的浏览器的显示有很大不同,那么您需要提高您的内容,以便Googlebot查看到的内容和访问者看到的内容一致。

    有些网站不喜欢google和其他搜索来获得它网站内容的快照,那么可以用下面这段代码来阻止:
    <meta name=”robots” content=”noarchive”>
     因此,当这些用户在搜索引擎上输入的你的网站排名不错的关键词的时候,他们会按一下,希望能更好地阅读和理解您的内容/服务。有一些不可避免的情况发生时,比如服务器关闭或者你的网页加载太慢的时候,用户的最常见的反应是按浏览器的后退按钮并且查看你的网站在google搜索结果中的网页快照。
如果你用了上面的元标记,google就不会显示你的网页快照,其结果是不好的用户体验,因为潜在的读者或者客户没法查看和阅读你网站的服务。如果他们能够这样做,他们很可能在将来是你忠实的客户。
       这就是为什么google快照经常可以作为一个你网站无法正确加载的时候的备份。在这种情况下,用户可以用快照记录一些信息而且在你网站可以访问的时候来购买商品,调查或者其他他们需要的你可以提供的服务。

    建议:
    1.如果你的网站包含了一些你不希望被google快照抓去的机密信息的时候,你发布网站的时候就要多多考虑下了。如果网站有一些风险或者有一些用户没必要阅读的内容,不希望被google快照索引的时候,你可以通过robot.txt或者no index标签来防止google索引这些url。更加稳妥的做法,是你用google的url移除工具来移除这些url,当然是在它已经被block,404或者加入no index标签之后。
       2.为了更好的用户体验,强烈建议在你网页站重要的页面保留快照(特别是那些你需要比较好的排名或者排名已经比较好的网页)。
       3.对seo来说,内容是相当重要的,快照页面给用户提供了互动的另外一条途径。他们可以在你的服务器或者网站没法打开的时候来阅读你的内容。在那种情况下,他们可以记录你的网址,并且在将来再次来访问你的网站,甚至加上链接-这对你的seo是有帮助的,

http://www.seochat.com/c/a/Google-Optimization-Help/Getting-SEO-Information-from-Googles-Cache/1/

      谷歌的快照在搜索结果中已经存在了一段很长的时间。事实上,谷歌的快照在搜索引擎优化策略和分析中往往被忽视。但是,好好地使用它你可以获得很多有用的信息,可以增加潜在客户,销售,用户满意度,甚至帮你找到你的网站存在不少问题。本文将仔细研究谷歌的快照,并且给出一些搜索引擎优化策略中可以使用的的可行的建议和方法。
google快照的基本组成部分
在我们深入之前,先了解下google快照是有帮助的,你可以用三种不同的方法来查看你网站的google快照。

方法1:当你访问的网址,您需要查看谷歌的快照,请按一下谷歌工具栏(例如,使用Firefox浏览器),在下拉框中,点击“谷歌的网页快照。”

方法2:在谷歌搜索结果显示的网址,您需要查看,点击“快照”链接。

方法3:在谷歌搜索框中,键入:

缓存:www.thisisyourdomain.com / thisisthepage.htm

或者如果您检查您的主页:

缓存:www.thisisyourdomain.com/

google的快照中包含这些信息:
1.谷歌网页的快照日期
2.text-only版本的链接
3.google快照内容的html视图

你可以在google快照的最上面找到一些google快照的头部信息(包含快照日期以及“纯文字版本”的链接)google快照的html视图一般当作目前浏览器中的默认快照视图。

一个XML站点地图是google建议通过谷歌网站管理员工具提交给他们的网站地图。这不是你通常访问别人网站时候看到的站点地图。相反,它是一种可以帮助谷歌抓取您的网站的地图,这篇文章将告诉你如何生成。
请注意,这种地图是游客不会访问到的,所以,你不能增加一个能让访客看到这个xml地图的链接,XML网站地图是为搜索引擎服务的,比如googlebot。
如果你是刚接触网站地图而且对它们感到迷惑的话,下图就是它们之间的明显的不同点:
xmlsitemap1
xml网站地图的目的是告诉googlebot你所有的规范的网址,有些网址可能googlebot通过正常的爬行发现不了。所以有个xml网站地图是相当有必要的:
第一,在防止重复的内容,一个XML站点地图结合再次确认您的robots.txt规范网址,并让您的网站更好地暴露在了Googlebot抓取过程。如果使用一个XML站点地图消除了你网站的网站重复内容的网址(结合的robots.txt,权威链接规范的方法和重定向方法),这样你的链接就会变得很公正而且这些链接都能获得应有的权重,重要的页面也能在google上有较好的排名。
第二,如果你有一个很大的网站(就像一个巨大的电子商务网站)里面的产品和品类成千上万的网址,这在一个正常网页Sitemap上列出他们是不可能的。这点XML站点地图可以做到,它可以显示大量的网址,告知googlebot您的网站的网址了。这为推出新的网站相当有帮助。
以上说的主要是xml和普通站点地图的区别和用处。下次具体说明怎么创建xml地图。

Google现在给我们带来更加实时的搜索结果
目前twitter非常流行是因为twitter正在试图成为一个实时的搜索引擎,这让google开始有行动了。
虽然我们都知道创新的和唯一的内容对于你建立一个强有力的权威的站点是必不可少的,而且对于你新发布内容很油帮助。从我过去的几天里我看到,搜索引擎算法有些许轻微的变化,对于权威有力站点上新内容的发布给与了了更高的权重。
看上去,对于一些竞争相当激烈词语,当一个新的内容发布然后被索引的时候,它会很迅速的被放到前十位,但是过了几天,会掉到第二页,第三也,甚至从搜索结果消失。
这看上去似乎是google改变了一些算法,更多的让新内容出现在搜索结果里面。当然有点额外的小泄露也是不错的。


一个很好的例子就是“seo”这个词语,首先是 Dave Naylor的关于geo targeting文章出现在前十然后随着时间变化排名渐渐掉到后面,接着是search engine journal出现在第一页,然后也慢慢的消失。
我也看到很多其他的搜索结果出现了这种情况

http://www.seotops.com/google-are-now-bringing-in-more-real-time-results_1096/