搜索引擎优化
Search Engine Optimization
简介
SEO是Search Engine Optimization的缩写,用英文描述是to use some technics to make your website in the top places in Search Engine when somebody is using Search Engine to find something,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。与之相关的搜索知识还有Search Engine Positioning(搜索引擎定位)、Search Engine Ranking(搜索引擎排名)。
SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。
在国外,SEO开展较早,那些专门从事SEO的技术人员被Google称之为“Search Engine Optimizers”,简称SEOs。由于Google是目前世界最大搜索引擎提供商,所以Google也成为了全世界SEOs的主要研究对像,为此Google官司方网站专门有一页介绍SEO,并表明Google对SEO的态度。
本身SEO的出现最早是研究搜索同HACK找寻漏洞的技术发展中引渡过来的,一部分人发现了这个可以左右搜索排名的机制问题,而在世界顶级搜索引擎GOOGLE的飞速发展及排名算法机制不断更新的情况下,SEO技术及队伍也在近些年来飞速发展和壮大,人们对SEO技术的认可和重视也与日具增。
SEO又分为站外SEO和站内SEO
站外SEO
站外SEO又说成是脱离站点的搜索引擎技术,命名源自外部站点对BLOG在搜索引擎排名的影响,这些外部的因素是超出BLOGGER的控制的.最有用功能最强大的外部站点因素就是反向链接.即我们说所的外部链接.
毫无疑问,链接对于一个站点收录进搜索引擎结果页面起到了重要作用.简单来说,每一个链接到你(BLOG)的站点,都被搜索引擎视为对你的网站信任度投了一票.
理想上来说,最好的反向链接是来自具有高质量和排名的站点链接.它们比通过相关关键词链到你写的相关话题的链接具有更好的效果.然而你并不能强使别人链接到你的BLOG,你所做的只是想像.
那么如何产生高质量的反向链接?
我们都知道得到高质量的链接不是容易的事,大部分情况下它链的别人,所以你如何获得这样的链接?
高质量的内容—-有各种各样的方法来为 BLOG产生外部链接,我所知最好的方法就是写高质量的内容,你的内容使读者产生阅读的欲望.你可以恳求获得链接,也可以注册自动生成链接的程序,甚至去其它的站上买链接.但最便宜最安全的方法就是以自然有组织的方式让别人链接到你的高质量内容.
注意跟你内容相关的BLOGGER—-我并不提倡给其它的BLOGGER群发邮件来交换链接,但我建议如果你在某个话题写了篇有质量的文章,并且觉得会使其它的BLOGGER感兴趣,那给这些 BLOGGER发一封短小礼貌的EMAIL让他们知道你的文章,将是有价值的.即使他们没有链接,也不要感到尴尬.你会发现如果他们点击了就为链接产生了直接的流量,从而在搜索引擎里提高了PR值.
分类目录—-另一个产生反向链接的方法是把你的BLOG提交到分类目录.我知道很多站长都很对这个策略的效果深信不疑,当开始一个新站点的时候,他们做的第一步就是围绕分类目录做工作,选择合适的关键词提交到关键词页面进行链接.有很多分类目录,大部分是免费的,这里有一个 BLOG分类目录列表,包含了大部分的BLOG搜索引擎,你也许想提交一下.
BLOG的内部链接—-随着BLOG的发展与数量的增长,BLOGGER开始关注或建立BLOG网络,就像人们所说的”链接工厂”.BLOG网络的好处之一在于BLOG”门页”之间彼此互相链接.这样,你就可以控制来自多个域名的站点.这种方法其实是没有意义的,而且你要当心,如果你的所有站点在同一服务器上,搜索引擎很容易查到这些链接,并降低这些链接的信任值,页面等级降为零.
买链接—-许多专业网站都有预算从其它高质量排名的网站上买链接 ,这儿我就不多说了.
交换链接—-内容相似的BLOGGER之间都会相互交换链接.有时候这个行为发生的相当自然(就像你看到某人链接到了你的BLOG, 然后你出于礼貌会进行回链)但是多数情况下链接都是利益目的性的,在两个BLOGGER间的链接就是一种形式.我几乎每天都收到这样互惠的链接请求(我很少响应).虽然这样的交换链接会有一定的利益,我还是要在这儿警告一下大家,作为SEO专家应该很清楚,搜索引擎有许多方法来追踪这样的交换性链接, 对其进行贬值.有些试图绕过直接链接而进行三角性的转换,它们代替A和B做直接交换,并把其它的站包含进来.例如,A链接到C,实质上是为了交换到D(当然D的拥有者跟C是同一个),有点令你头痛了是不?!还有各种各样的系统声称会为你建立一个安全的内部链接,我知道大部分人用 Digital Point’s Free C0-Op Advertising系统.个人而言,我会尽力避免这样的方案,有方针性的链接到站点对我的读者来说才是有价值的.
站内SEO
刚刚分析了脱离站点的搜索引擎技术 ,我将转向注意力分析另外一些因素,当你建立BLOG的时候就可以运用了.(专业搜索引擎技术–当你在BLOG上做这些事情的时候将会帮助你的BLOG建立更高的排名).做好SEO专业技术有方方面面,围绕SEO的投机技术也有许 多,我这里尽可能的介绍一些:
写丰富关键词的内容—-为你的文章增加新的关键词将有利于GOOGLE蜘蛛爬行文章索引.但不要堆砌太多的关键词,除了考虑”如何做能让人们在搜索引擎中找到这篇文章”?如果人们在GOOGLE中找的内容你文章中有,那你得考虑他们会在GOOGLE中输入什么词来搜索相关文章?问题的答案说明,你应该将这个词贯穿你的整篇文章.
这些关键词需要在你的文章中被频繁的提及,你可以遵循下面的方法:
关键词应该出现在网页标题标签里面;
URL里面有关键词,即目录名文件名可以放上一些关键词;
在网页导出链接的链接文字中包含关键词;
用粗体显示关键词(至少试着做一次);
在标签中提及该关键词(关于如何运用head标签有过争论,但一致都认为h1标签比h2, h3, h4的影响效果更好,当然有些没有运用head标签的网页也有很高的PR值);
图像ALT标签可以放入关键词;
整个文章中都要包含关键词,但最好在第一段第一句话就放入;
在元标签(meta 标签)放入关键词(这点的价值越来越低,但仍有些人相信这对某些搜索引擎是有用的);
注意不要为了优化而把文章都填充上关键词,形成关键词堆砌,从而毁了你的文章,也扭曲了你写这个文章的意图.大部分SEO专家建议关键词密度最好在5-20% 之间,我认为20%的密度就可能破坏了你的文章.
最后还想说一点,不要为了做SEO优化,而放弃了用户对你的BLOG体验.虽然关键词密度对搜索引擎的爬行很重要,但最重要的是BLOG的内容和设计对读者是友好的,要提高读者的体验.没有什么比全部填充了关键词的BLOG更糟糕的了,千万不要成为这样的案例.
主题BLOG—-从我最近读的SEO理论中了解到,如果你的BLOG写的都是关于同一主题,那么它可能将获得较好的排名.例如,一个主题的BLOG将比那些涵盖了多个主题的BLOG的排名要高.建立一个200多页的BLOG,内容都是同一个主题,这个BLOG的排名就会不断的增加, 因为在这个主题里你的BLOG被认为具有权威性.考虑一下这个建议保持你的BLOG在一些相同的主题上.当然不这样做也并不意味着你的BLOG永远不能获得较好的排名.它只是考虑的一个因素.
站点设计– –搜索引擎更喜欢有好的网页结构,无误的代码和明确导航的站点.确保你的页面都是有效的和在主流浏览器中的可视化.搜索引擎不喜欢太多的Flash, frames和java script脚本,所以保持站点的干净整洁,也有利于搜索引擎蜘蛛更快更精确的爬行到你的索引.
站点的内部链接– –搜索引擎的工作方式是通过蜘蛛程序抓取网页信息,追踪你写的内容和通过网页的链接地址来寻找网页,抽取超链接地址.许多SEO专家都建议BLOG提供网站地图,在BLOG上的每个页面之间最好都有一个到两个的深入链接.BLOGGER要做的第一步是确保导航中包含目录页面 ,也要确保每个子页面都有链接回到主页面和其它的重要页面.
有规律的更新—-BLOG更新的次数越频繁,搜索引擎蜘蛛爬行的也就越频繁.这意味着BLOG新文章几天甚至几 小时内就可以出现在索引中,而不需要等几个星期.这是BLOG最好的受益方式,尽可能的这样做吧.
导出链接– –关于搜索引擎如何对待导出链接争论激烈.我一直相信相关的导出链接会提高BLOG在搜索引擎中的排名.我常常在文章中链接到其它相关站点,我想这对我的读者们是有用的,也有一些轶趣的证据来支持这种理论.在你的BLOG链接到外部站点,将减少BLOG的部分流量,所以你需要计算一下这样做的损失.注意: 你也应该尝试到一些权威的相关站点上做些链接到你自己的BLOG.记住太多的导出链接将影响降低你的BLOG,正如SEO所说,适度是关键.
明智的选择域名– –选择域名有大量的因素.最重要的一点是如有可能尽量包括关键词.第二你应该花一点时间看看之前是否有人注册过这个域名.当然效果也是两性的.如果之前有高质量的站点和它做反向链接,那你就受益了.但是也有可能做反向链接的都是一些垃圾站点,那你可能会被GOOGLE禁止很长一段时间.这个检验过期域名的反向链接工具你也许会用到.
尽可能早的注册域名—-GOOGLE的行为方式证明较早注册的域名会获得更高的排名.这样做是因为,很多垃圾站点只是短期注册,域名时间长证明你的主旨是在建站,并会较长时间的运营它.
每篇文章的主题—-一个页面的主题越紧凑,搜索引擎对它的排名就越好.有时也许你发现你写了很长的文章,覆盖了一些不同的话题,它们的相关性并不高.如果你关心搜索引擎的排名,那最好把这样的文章切块,分成几个主题更密切的文章.
写适宜长度的文章—-关于搜索引擎优化有一些人认为太短的文章不能获得较高的排名. 一般我控制每篇文章至少有250个字.当然我的BLOG中也有更短的文章,但是如果我想让文章有好的排名,我会注意控制它的长度.另一方面,也不要让文章显得太长,因为这将不利于你保持关键词的密度,文章看上去也缺少紧凑.研究显示过长的文章会急剧减少读者的数量,他们在看第一眼的时候就选择了关闭文章.
避免内容重复—-GOOGLE在使用指南中严重警告过关于多个网页相同内容的问题.不管这些网页是你拥有的还是别人拥有的.因为一系列的垃圾站点就是不断复制网页内容(也窃取别人网站内容).有一些争论关于什么样的内容算复制,什么样的不应该包括在内(比如,许多 BLOGGER喜欢把免费文章共享在自己的BLOG上,这些文章曾出现在数千百万的网页上)我的建议是如果你的BLOG内容出现在许多地方那你就要小心了.
Ping—-像Pingomatic 这样的服务,它可以帮你ping到其它站点,提示你的BLOG内容已更新.这样,搜索引擎知道你的文章已更新,从而吸引蜘蛛过来爬行.
提交BLOG的RSS到MyYahoo—-提交BLOG的RSS种子到Yahoo的MyYahoo阅读器,这会有利于yahoo索引.你也可以提交到Google’s Personalised pages ,这会有相同的功效.
目录的数量– –当我的目录过多的时候,我自己都会陷入麻烦.我认为大站点的等级比小站高,当然一些小站点也有高的等级,这并不是标准.目录越多,搜索引擎搜索的也就越全面.如果你有太多的页面,你需要组织它们以方便搜索引擎爬行.我的意思并不是随便建立一些无谓的垃圾目录,请注意,随着时间推移,最好建一个大而全的站点.
提交到搜索引擎—-如果你做了所有站内SEO都该做的事,BLOG却还没有出现在搜索引擎中.那是因为搜索引擎还没有开始收录.每个搜索引擎都允许用户提交未收录站点.一般需要很长一段时间来等待搜索引擎的收录,也许更快的方法还是得到已经被搜索引擎收录的站点的链接.
SEO是依据通过对搜索引擎长期摸索、观察得出来的技术与经验,利用搜索引擎录取网站的规则,将网站的整体结构、网站布局、关键词分布及密度进行优化,使网站对搜索引擎的抓取有友好性,从而进行搜索引擎优化,达网站到提高排名效果。
小心作弊者!
由于搜索引擎的排名规则及算法是不固定的,是在不断改变中的,而且这些规则和算法又是绝对的商业机密,所以是不可能达到保证排在某几位的效果的。
据了解,目前有很多的人打着SEO的旗号,自称可以将您的网站排在百度、Google的第一位,而做法则是作弊的手段,使您的网站的确可以在短时间内升到很靠前的位置。但是搜索引擎是可以识别这些手段被加以惩罚的。被惩罚的网站,最严重的是您的网站在各大搜索引擎完全消失,甚至不再录取。
所以希望大家谨慎分辨,不要为了一时之利,使您的网站成为作弊者的牺牲品。
影响SEO的主要因素
第一部分:域名和主机对 SEO 的影响
域名与主机是网站的基础,商业网站选择域名与主机尤其应注重形象和质量,为网络营销开展打好坚实基础。同时,选择好域名与主机也是搜索引擎优化开始的第一步。
域名选择与 SEO
域名与 IP:
每一个网站的域名对应一个 IP 地址,IP 地址是在网络上分配给每台计算机或网络设备的数字标识。域名必须经过域名服务器(DNS)进行解析,转换成数字 IP,才能让计算机理解辨认,如:219.136.248.149 ,大部分中小企业网站都存放在由一台服务器划分出来的若干虚拟主机上,由多个网站共享一台服务器和 IP 地址,一些 WEB 服务器中有成百上千个域名共享一个 IP 地址的情况。这样对站长来说成本较低,但对网站的搜索引擎排名带来以下潜在风险:
1、共享主机的其他网站如果被搜索引擎惩罚,将或多或少波及你的网站。对此,AltaVista有如下忠告:“如果同一 IP 下有一个网站作弊,那么我们的搜索引擎会对该 IP 下的所有网站进行惩罚”;不过幸运的是,大部分搜索引擎不会如此武断,如 Google,一般是不会进行这种连带性惩罚的。
2、如果搜索引擎对有些 Spammer 服务器进行了惩罚,其 IP 被认为是 Spam,则连带该 IP 下的所有网站都会受到牵连,使这些网站的排名下降或在搜索引擎中被清除。
工具推荐:
查域名 IP:http://www.123cha.com/ip
IP 反查:http://www.whois.sc/members/reverse-ip.html (查看某 IP 地址下共享哪些域名。免费注册)
二级域名(次域名):
二级域名形式如:yourname.site.com,而不是 www.yourname.com。拥有自己的独立域名是网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。这都极不利于搜索引擎重视你的网站,二级域名除了用户访问不方便以外,还主要有以下弊端:
1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
2.很多搜索引擎会规定每个域名下的收录数(如:www.seochat.org、english.seochat.org 与 bbs.seochat.org),如果 www.seochat.org 这一域名的收录数上限是 30,而你的网站是第 31 个,则你的网站被搜索引擎收录的机会就会少至又少了;
3.当域名供应商停止营业,那么你辛苦经营的网站也随着你域名的失去而付诸东流;
4.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
最好为自己的二级域名网站注册一个独立域名,然后做域名转发(免费),目前很多拍卖网的店铺都适合采用此种方法,对顾客访问和网站管理很有用。
域名中的字符:
取域名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.made-in-china.com 而不是 www.madeinchina.com。这是因为搜索引擎通常会把分隔符“-”当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分(尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如 www.madeinchina.com 被认为只有一个词 madeinchina,而 made-in-china 则被看作正常的made in China 词组。
有些搜索引擎目录对网站在分类目录中的排名顺序是根据域名或网站 title 名称的数字顺序或字母顺序甚至中文笔画,总体上数字又比字母靠前。Yahoo!中国称,“在同一类目中, 网站是按照拼音顺序来排列的”。Google 则根据其独创的“网页级别”技术“分辨出常用的重要网站,排放在目录的前面以提升网页搜索的效率”(Google 语)。
此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站的后缀.org 和.net 有着比.com 更高的排名优势;对中文网站来说,表示中国域的.cn和.com.cn 又比无地区性的.com 有一定优势。
附 : ICANN 授 权 的 中 国 顶 级 域 名 注 册 商 及 其 授 权 域 名 注 册 范 围
http://www.wm23.com/resource/R02/domain_2004.htm
工具推荐:
www.whois.sc 查询在核心字符下尚可注册的域名
主机选择与 SEO
主机服务商选择:
主机对网站的搜索引擎排名影响很大。在寻找主机提供商的时候,千万不要只考虑价格因素。如果你多次向 Google 提交网站,但 Google 却一直没有对其进行索引,则有可能是网站所在的服务器出了问题。因此选择服务器时要特别注意以下几点:
1、避免使用免费主机:由于免费主机里面经常会出现 Spammers、镜像网站、桥页等“搜索引擎垃圾”,很多搜索引擎都不愿意索引免费主机上的网站;同时搜索引擎目录如 Yahoo 也很难收录来自免费主机的商业站点。此外,免费主机的服务很难保证,常常服务器超载,速度奇慢,宕机频繁,甚至关闭服务,这都会直接影响网站排名。
2、选择有信誉的主机提供商:搜索引擎的索引程序定期或不定期地来访问收录的网站。对经常更新的网站,Google 的 Googlebot 漫游器——俗称“蜘蛛”,一般每天都会小幅度地“爬”一下,一个月进行一次大的索引。如果蜘蛛在索引时出现网页打不开或下载速度缓慢,则放弃索引。所以你的网站在任何时候都要正常工作,以博取蜘蛛的欢心。这就要求网站存放的主机系统提供快速、稳定、安全的服务,最好有 24 小时客服支持和维护,保证你的网站快速、可靠、稳定地运行。
主机转移:
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器 (DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的 IP 地址。把旧的域名服务器改成新的,这个过程到生效时间大概 24-48 小时之内,少数情况下可能要 72 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的 IP 地址上的网站,要么抓到新的域名解析生效后的网站, 总之都不会出现网站打不开的空档。
第二部分:搜索引擎优化的核心:关键字策略
根据潜在客户或目标用户在搜索引擎中找到你的网站时输入的语句,产生了关键字 (Keywords)的概念,这不仅是搜索引擎优化的核心,也是整个搜索引擎营销都必须围绕的核心。
关键字的选择
首先确定你的核心关键字,再围绕核心关键字进行排列组合产生关键词组或短句。对企业、商家而言,核心关键字就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。总结起来,选择关键字有以下技巧:
1、站在客户的角度考虑
潜在客户在搜索你的产品时将使用什么关键词?这可以从众多资源中获得反馈,包括从你的客户、供应商、品牌经理和销售人员那里获知其想法。
2、将关键词扩展成一系列词组/短语
毋用单一词汇,而是在单一词汇基础上进行扩展,如:营销→网络营销→网络营销管理。英文关键词可以采用搜索引擎 overture 的著名工具 Keyword Suggestion Tool 对这些关键词组进行检测,可查看你的关键词在过去 24 小时内被搜索的频率,最好的关键词是那些没有被广泛滥用而又很多人搜索的词。中文工具可以通过百度的“相关搜索”和 Google 提供的KeywordSandbox 工具进行关键词匹配和扩展。
工具推荐:
Google AdWords 关键字工具:查询特定关键词的常见查询及扩展匹配
https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度
http://www2.baidu.com/inquire/dsquery.php
3、进行多重排列组合
改变短语中的词序以创建不同的词语组合。使用不常用的组合。组合成一个问句。包含同义词、替换词、比喻词和常见错拼词。包含所卖产品的商标名和品名。使用其它限定词来创建更多的两字组合,三字、四字组合。
4、 毋用意义太泛的关键字。
如果你从事包装机械制造,则选择“机械”作为你的核心关键字就无益于吸引到目标客户。实际上,为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息(尤其是二词组合),而不是使用那些大而泛的概念。此外,使用意义太广的关键字,也意味着你的网站要跟更多的网站竞争排名,难以胜出。
5、用自己的品牌做关键词
如果是知名企业,则别忘了在关键词中使用你的公司名或产品品牌名称。
6、使用地理位置
地理位置对于服务于地方性的企业尤其重要。如果你的业务范围以本地为主,则在关键词组合中加上地区名称如“深圳网站建设”。
7、回顾竞争者使用的关键词
查寻竞争者的关键词可让你想到一些你可能漏掉的词组。但不要照抄任何人的关键词,因为你并不清楚他们如何要使用这些关键词——你得自己想关键词。寻找别人的关键词只是对你已经选好的关键词进行补充。
8、不用与自己无关的关键字
总是会有人将热门的词汇列入自己的 META 关键字中——尽管这个热门关键字跟自己网站内容毫不相干。甚至有人把竞争对手的品牌也加入到自己的关键字中,这不仅侵权,可能被起诉(国外多起类似案例),并且由于这些所谓“热门”词汇并未在网站内容中出现,因此对排名并无实质帮助,过多的虚假关键词还可能受到处罚降低排名。
9、控制关键词数量
一页中的关键词最多不要超过 3 个为佳,然后所有内容都针对这几个核心关键词展开,才能保证关键词密度合理。搜索引擎也会认为该页主题明确。如果确实有大量关键词需要呈现,可以分散写在其它页面并针对性优化,让这些页面也具有“门页(entry)”的效果。这也是为什么首页和内页的关键词往往要有所区分的原因。最典型的情况是拥有不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
附:查看竞争对手关键词的方法:在浏览器中打开目标网页→点击“查看”→点击“源文件”→“<meta name="keywords" content=”后面的文字即该网站关键词
关键字密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。关键字在网页中出现的频次,即关键字密度 (Keyword Density) ,就是在一个页面中,占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到重要作用。关键字密度一般在 1% 到 7% 较为合适,超过这一标准就有过高或过低之嫌。切记避免进行关键字堆砌,即一页中关键字的出现不是根据内容的需要而安排,而是为了讨好搜索引擎人为堆积关键字(Stuffing)。这已经被搜索引擎归入恶意行为(Spamming), 有遭到惩罚的危险。
工具推荐:
关键字密度检查(英文):频繁出现的关键词及其密度
www.seotoolkit.co.uk/keyword_density_analyser.asp(适用于英文关键词)
关键字分布
关键字的分布原则堪称:无所不在,有所侧重。
1、网页代码中的 Title,META 标签(关键字 keywords 和描述 description)
如:e 书时空 www.eshunet.com 的代码:
<title>e书时空——电子书公益下载中心</title>
<meta http-equiv="title" c>
<meta name="classification" c>
<meta name="description" c>
<meta name="keywords" c>
2、网页正文最吸引注意力的地方
正文内容必须适当出现关键词,并且“有所侧重”,意指用户阅读习惯形成的阅读优先位置——从上到下,从左至右——成为关键词重点分布位置,包括:页面靠顶部、左侧、标题、正文前 200 字以内。在这些地方出现关键词对排名更有帮助。如 SEO 学习网站www.seochat.org 的站长独辟蹊径,把一段富含关键词的文本网站介绍置于网站最顶部(这个地方通常被安排用来放 banner 广告的)。这样做的好处是让用户和蜘蛛都以最快速度了解该网站内容,并且以蜘蛛重视的<b>黑体显示,对其排名作用很大。代码显示如下: <b><font color=#999999>本站是一个非商业性的网站,旨在为广大的搜索引擎研究者提供一个学习、交流场所。在这里你可以找到很多有关于搜索引擎优化资料(seo 资料,文章)、网站优化资料。这些资料可以帮助你将你的网站进行适当的优化以迎合多个搜索引擎的搜索规则,从而得到较好的排名。< /font></b>
3、超链接文本(锚文本)
除了在导航、网站地图、锚文本中有意识使用关键字,还可以人为增加超链接文本。如一个童装厂商网站可以通过加上以下行业资源:中国童装网 织里童装网…… 等含有“童装”文字的链接来达到增加超链接文本的目的。这也值得网站在添加友情链接时做参考,即链接对象中最好包含有你的关键字或相关语义的网站。
4、Header 标签
即正文标题<H1><H1/>中的文字。搜索引擎比较重视标题行中的文字。用<b></b>加粗的文字往往也是关键词出现的地方。
5、图片 Alt 属性
搜索引擎不能抓取图片,因此网页制作时在图片属性 Alt 中加入关键字是对搜索引擎友好的好办法,它会认为该图片内容与你的关键字一致,从而有利于排名。
英文网页内容的网站在进行域名选择和网页文件夹命名时,也可以考虑包含关键字(对关键词组则要用短横线隔开),如 www.made-in-china.com。不过对 Google 排名作用非常微小。
第三部分:对搜索引擎友好的网页设计制作
一般的网页设计都由网页设计师完成。设计师设计网站往往仅从美观、创意和易用的角度考虑,这对于一个期望获得搜索引擎排名优秀的商业网站来说,已经远远不够了,网站策划人员至少应该为设计师递交一份需求备忘录,提醒在设计中需要配合和注意的环节。
目录结构和 URL
URL 是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于 URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:http://www.yoursite.com/dir1/page.htm www.yoursite.com 是域名,dir1 是一级目录名,page 是文件名。对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样: http://www.yoursite.com/dir1/dir2/dir3/page.htm 搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过 3 层,如果超过 4 层,象以下这个页面,搜索引擎就很难去搜索它了:
http://www.yoursite.com/dir1/dir2/dir3/dir4/page.htm
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页提供了重要内容,有大量来自其它网站的外部链接(Inbound Links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索 Spider 还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。此外,图形、脚本、CGI-BIN 和 CSS 样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符“-”和下划线“_”进行分隔,URL 中还经常出现空格码“%20”。因此,如果以“中国制造”作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
但事实上,至少在目前 Google 并不认同“_”为分隔符。对 Google 来说, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就被读成了 madeinchina,连在一起之后,关键词就失去了意义。因此,目录和文件名称如果有关键词组,要用连字符“-”而不是下划线“_”进行分隔。
URL 应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于 URL 中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对URL和相对URL:
绝对URL:即网页路径使用包含顶级域名在内的完整的URL。 如 :www.yoursite.com/page1/index.html 是一个绝对路径,其中/page1/index.html 则为相对路径,由浏览器自动在该链接前加上 www.yoursite.com。总体上,Google 在排名时并不在意 URL 使用的是相对路径还是绝对路径。
动态 URL:目前很多网站都有数据库驱动生成的 URL,即动态 URL,往往表现为在 URL 中出现“?”、“=”、“%”,以及“&”、“$”等字符。动态 URL 极不利于搜索引擎抓取网页,严重影响网站排名,通常是通过技术解决方案将动态 URL 转化成静态的 URL 形式,如:
将 http://www.domain.com/messages.php?id=2&type=5
转化为 http://www.domain.com/messages/2/5/
下文将会专门提到动态 URL 的解决方案。
导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、 主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、 “面包屑型(Breadcrumbs)”路径
所谓“面包屑”是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失“方向”,并方便回到上级页面和起点。路径中的每个栏目最好添加链接。如下:
时代营销:首页 > 网络营销动态 > 特别报道
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的 LOGO作链接。
3、首页突出重要内容
除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别 (PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在 SEO 中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google 明确提出“如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页”。
工具推荐:
Xenu:http://home.snafu.de/tilman/xenulink.html 生成网站地图
框架结构
框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO 部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在 URL 中体现出来,即使进入深层子页面,浏览器显示出来的 URL 仍然是主页的 URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向 frame 页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用 iframe 即内联框架(Inner Frame)技术来避免 Frame 带来的不便。所谓 iframe 也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe 可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为: <iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>” 对搜索引擎来说,iframe 中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将 iframe 内容看成单独的一个页面内容,与被内嵌的页面无关。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过 20 秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt 属性:
每个图像<IMG>标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。 如:www.marketingman.net/wm37.htm 的书籍广告图片代码为: <img src="images/webmarketing2_cover_200.jpg" width="200" height="259" alt="《网络营销基础与实践》第 2 版(冯英健著,2004)" border="0">
文本说明:
除了 ALT 属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的 heading 标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如“更多某某”链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而 Alt 属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
Gif 和 JPGE 图像优化:
Alt 属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有 GIF 和 JPGE 两种形式。一般来讲,GIF 适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少 GIF 颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop 的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
工具推荐(英文):www.xat.com/internet_technology/download.html (图片优化工具)
FLASH 优化:
由于 FLASH 优美的视觉效果和广阔的创意空间,FLASH 技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用 FLASH 设计。但 FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别 FLASH 中的信息。Google 也只能检索到部分 Flash 文件中的内嵌链接。以下列举一个制造机电设备的企业网站首页的代码,用 FLASH 制作,请注意是否可以看见有意义的文本:
<html>
<head>
<title>Welcome</title>
<meta http-equiv="Content-Type" c>
<style type="text/css">
<!-- body {
margin-left: 0px;
margin-top: 0px;
margin-right: 0px;
margin-bottom: 0px;
}
-->
</style>
<link rel="stylesheet" href="style.txt" type="text/css">
</head>
<body bgcolor="#FFFFFF" text="#000000">
<table border="0" width="100%" height="100%" cellspacing="0" cellpadding="0">
<tr>
<td width="100%" background="images/bg.jpg"><div align="center">
<center>
<table width="777" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
<td><object classid="clsid27CDB6E-AE6D-11cf-96B8-444553540000"
codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29
,0" width="777" height="455">
<param name="movie" value="index.swf">
<param name="quality" value="high">
<embed src="index.swf" quality="high"
pluginspage="http://www.macromedia.com/go/getflashplayer"
type="application/x-shockwave-flash" width="777" height="455"></embed>
</object></td>
</tr>
</table>
<br>
<span class="style2">
本页 使 用 FLASH 技 术 , 如 果 无 法 正 常 浏 览 请 下 载 并 <a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html"> 安装插件 </a>或<a href="asp-bin/big5/?page=1">直接进入 </a><br> if you are not able to view the animated a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">pleass install
plug-in </a> first <br><!--网站计数器开始-->
<Script language="JavaScript" src="counter/count.asp"></Script>
<!--网站计数器结束-->
</span>
</center>
</div> </td>
</tr>
</table>
</body>
</html>
同时再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:
Spidered Text (蜘蛛可识别的文本):
Welcome 本页使用 FLASH 技术,如果无法正常浏览请下载并 安装插件 或 直接进入 if you
are not able to view the animated pleass install plug-in first
Spidered Links(蜘蛛可识别的链接):
http://www.macromedia.com/shockw ... gerpages/flash.html
asp-bin/big5/?page=1 (下载 FLASH 插件的链接地址)
http://www.macromedia.com/shockw ... gerpages/flash.html
因此可以得出结论是:
蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该 Flash 首页中进入“中文版”“英文版”关键性内容的链接。
FLASH 优化可以从以下三个方面来考虑:
1、做一个辅助 HTML 版本:
保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。
2、将 Flash 内嵌 HTML 文件:
还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从 HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。即使首页全部动用了 FLASH,也应该将进入内页的关键性按钮/链接置于 FLASH 文件之外,以独立纯文本链接的方式呈现。上文案例将“中文版”链接置于 FLASH 文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、付费登录搜索引擎:
如果 FLASH 网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用 FLASH,站点间进行广告交换时也要避免采用 FLASH 广告为上策。
表格使用
表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称“网页减肥”),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在 15K 左右,最好不要超过 50K。网页减肥重点涉及以下几个要点:
CSS 样式
网页制作应通过 CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过 css 可以控制任何 HTML 标签的风格。例如<td>,<p>,<body>,<table>,<tr>,< th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color:
#FFCCCC; font-weight: bold}
h1 { font-family: "Arial"; font-size: 12pt; color: #993300}
-->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外部文件中。通过设置 CSS 样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
JavaScript:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用 JavaScript 技术的网页往往在页面一开始就堆积大量 JAVA 代码,以至 META 及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、 将脚本移至页面底部
大部分的 JAVA 代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、 将 JAVA 脚本置入一个.js 扩展名的文件。
包含你的 JavaScript 的.js 文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。
例:一段 JAVA 代码正常情况下显示如下:
<script language=JavaScript>
<!--
此处是你的代码,将它们拷贝到一个.js 文件
//-->
</script>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js 的文件,如文件名为 “mycode.js”的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的 JavaScript 置换为简单的一行: <script language=JavaScript src=mycode.js></script>
这样,一个“mycode.js”文件就将大段冗长复杂的 JAVA 代码置换了。
工具推荐:
网页减肥工具:http://202.99.237.33/softdown/softdoc/net_opt.htm 去除网页中多余代码,减小网页。
第四部分:SEO 指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO 思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
Title 和 Meta 标签
以.html 或.htm 为扩展名的 HTML 文档称为静态网页。Meta 称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta 值来给网页分类,是籍此判断网页内容的基础。其中最重要的是 description(网站描述)和 keywords(网站关键词)。另外一个基本的属性是 Title 标签,提示搜索引擎关于本页的主题。Meta 和 Title 的形式在 html 语言中体现为:
<head>
<title>title 标题</title>
<meta name="keywords" c>
<meta name="description" c>
......
</head>
尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的 Meta 文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的 Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此,Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过 3 个词组。企业网站的 title 通常以公司名+关键词为内容。
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将 title 组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式。
title 关键词(Keywords):
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta 中的关键词书写技巧见前文的“关键词策略”。
描述(Description):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description 一般被认为重要性在 title 和 keywords 之后。描述的书写要注意以下问题:
1、 描述中出现关键词,与正文内容相关
2、 同样遵循简短原则,字符数含空格在内不要超过 200 个字符
3、 补充在 title 和 keywords 中未能充分表述的说明
其它 Meta 标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签: <meta name="Robots" c>其中:all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面上的链接不可以被查询;index:文件将被检索;follow:页面上的链接可以被查询;noindex:文件将不被检索,但页面上的链接可以被查询;nofollow:文件将不被检索,页面上的链接可以被查询。但并不是所有的搜索引擎都支持 meta 中的 robots 标签,但是所有搜索引擎都支持一个功能 ,更强的 robots.txt 的文本文件来达到上述功能(关于 robots.txt 文件应用的介绍,E 书专家平文胜曾专门撰文详细解说“robots.txt 和 Robots META 标签”)。其它常用 meta 标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的
……
首页、重要的内页的 title 和 meta 标签最好分别书写,针对栏目主题体现不同的内容。
动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用 ASP,PHP,Cold Fusion,CGI 等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm 或.cgi,而不是静态网页的.html 或者.htm。其 URL 中通常出现“?”、“=”、“%”,以及“&”、“$”等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。但大多数搜索引擎的蜘蛛程序都无法解读符号“?”后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持“动静结合,以静制动”的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是 CGI 或者 Perl,可用一个脚本拾取环境变量前的所有字符,再将URL 中剩余的字符赋值给一个变量。这样,你就可以在 URL 中使用该变量了。
不过,对于那些内置了部分 SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都能够提供索引支持。那些以.shtml 为后缀名的网页也被解析成 SSI 文件,相当于通常的.html 文件。但如果这些网页在其 URL 中使用的是 cgi-bin 路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用 ASP 开发的网页,一般后缀名为.asp。只要避免在 URL 中使用符号“?”,大多数搜索引擎都能够支持用 ASP 开发的动态网页。
3、Cold Fusion
如果你使用的是 Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来,最后到达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇“?”,因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器:
Apache 是最流行的 HTTP 服务器软件之一。它有一个叫做 mod_rewrite 的重写模块,即 URL 重写转向功能。该模块能够使你将包含环境变量的 URL 转换为能够为搜索引擎支持的 URL 类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在“静动结合,以静制动”的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从 SEO 的角度看是值得的。也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT 和百度等开始尝试抓取动态网站页面(甚至包括 URL 带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的 URL 地址,请注意:
文件 URL 中不要有 Session Id,同时不要用 ID 作为参数名称(特别是对于 GOOGLE); 如:《网络营销基础与实践 》一书 , 在当当网 的介绍页面URL地址是: http://www.dangdang.com/product_ ... p?product_id=493698,该页就无法被读取。参数越少越好,尽量不要超过 2 个;尽量不要在 URL 中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是 Google 来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links 或 backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录 ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库 Open Directory Project:www.dmoz.org。
ODP 的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。
在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于 Google 等重要搜索引擎都采用 ODP 的数据库,是 Google 每月一次深度索引的基础,因此向 ODP 提交网页成为每个网站完成后的首要工作。登录 ODP 目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于 DMOZ 目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向 DMOZ 提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆 DMOZ 非常困难,没有一个网站敢保证被 DMOZ 收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守 DMOZ 登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被 DMOZ 拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ 也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、作弊和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎作弊行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或“正在建设中”的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被 DMOZ 收录的机会很少。
4、确保网站中包含具体联系信息
一个 DMOZ 编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个 Email 地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击“提交网页”。
6、记下提交日期、目录名和编辑邮箱
向 ODP 提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要 2 周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向 DMOZ 下的相应目录进行提交。
一旦 DMOZ 收录了你的网站,那很快就可以被 Google,Lycos,Netscape,AOL, HotBot,DirectHit 等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括 Yahoo 目录。Yahoo 是最早开始做分类目录的网站,直到今天登录Yahoo 目录也是网站推广的重要环节。Google 把来自 Yahoo 目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文 Yahoo 实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。
总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
关于自动登录软件(Submitting Tools):
自从有了 B2B 商务平台和搜索引擎营销以来,就出现了向这些中间平台和搜索引擎提交供求信息或网站的自动登录软件,并一度在市面上广为流行。搜索引擎自动登录软件的功能是承诺将客户的网站一次性登录到全球 N 个搜索引擎目录,有的甚至保证可以使网站在搜索引擎中的排名获得极大提升。实际上,已经有诸多营销实践者对此类自动登录软件实际效果提出了质疑:
1、真正为网站带来访问量的搜索引擎主要集中于几大主流搜索引擎,其它的小搜索引擎搜索量极小,即使网站被这些小搜索引擎收录成功,也不能指望通过他们带来什么访问量。
2、 今天的主流搜索引擎目录往往采用付费登录或严格的人工审核,这些目录极其反感由自动登录软件提交的网站,有的明确提出拒绝自动提交方式。
3、在软件自带的几千个搜索引擎中,软件本身提示登录成功的大概有百分之六七十,是否真正登录成功,实际操作中很难一个一个去检验。
4、 如果网站有来自其它网站的导入链接,即使不用登录,主流搜索引擎机器人同样会抓取到你的网页。
5、如果从增加外部导入链接的角度出发,英文网站针对英文搜索引擎的自动提交可以一试,聊胜于无,但不可对其抱有太大的期望。
总体上,盛行于免费推广时期的自动登录软件在今天各大主流商业推广平台纷纷实施付费政策的商业模式下,已经越来越丧失价值。
高质量导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。网站即使没有向目录提交,但由于其他重要网站上有你的网站链接,一样可以获得搜索引擎的快速抓取,并为取得好排名加分。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站会提及你;对你提及越多,说明价值越大。由此引申出链接广度(Link Popularity)在搜索引擎优化中的重要地位。唯其如此,人们想方设法地为网站“制造”外部链接,导致涌出大量垃圾(spam)链接和网站,于是搜索引擎在算法调整中,仅对高质量的外部链接给予重视,对类似 Spam 的做法往往给予适得其反的结果。
因此,今天对链接广度要有这样的认识:即使获得上百个质量低劣的或内容毫不相干的站点的链接,也抵不上一个高质量且内容高度相关或互补的站点的链接。
链接质量分析:
来自以下网站的链接都可以称为高质量的链接:
搜索引擎目录中的链接以及已加入目录的网站的链接
与你的主题相关或互补的网站
PR 值不低于 4 的网站
流量大、知名度高、频繁更新的重要网站(如搜索引擎新闻源)
具有很少导出链接的网站
以你的关键词在搜索结果中排名前三页的网站
内容质量高的网站
相比高质量链接,以下链接堪称垃圾链接,对网站排名不起作用或起反作用:
留言簿、评论或 BBS 中大量发贴夹带网站链接
已经加入太多导出链接的网站(几十甚至上百个“友情链接”中有一个你的网站)
加入链接基地(Link Farm)、大宗链接交换程序(bulk link exchange programs)、交
叉链接(Cross Link) 等链接程序,与大量会员网站自动交换链接,被搜索引擎视为典
型的垃圾链接,极有可能受到惩罚或牵连。Google 就会对那些使用链接程序的站点进行永久性删除。
还有两种导入链接被误认为可以增加链接广度:
点击付费的搜索引擎广告链接,如百度竞价排名和 Google 的右侧关键词广告。
多层级的网络会员制联盟(Affiliate program)链接。
这些链接不会直接指向你的网站,而是指向盟主的网站,以方便他们跟踪点击计费,因此不会提高你网站的链接广度。当然,如果你本身主持该会员制联盟,你的服务器就在跟踪会员网站并将它们指回你的站点,这种情况下还是有助于提高你的链接广度。
怎样获得高质量导入链接:
1、 向搜索引擎目录提交网站: 见前文
2、 寻找网站交换链接
俗称友情链接或互惠链接。互惠链接的基础是你的网站内容具有较高质量,否则请求链接不容易成功。交换链接对象包括:
已经加入搜索引擎分类目录的相关网站 所有主要搜索引擎中的与你的行业相关的目录下的网站,都是理想的链接对象。
与你的竞争对手链接的相关网站
要找到这些网站,可以在搜索引擎中输入"link:",跟着输入竞争者的域名,如 "link:theirdomain.com" 和 "link:www.theirdomain.com." 。这样还可以在获得链接的同 时与对手竞争获得目标客户。
生意链中的对象:
竞争对手与你的主题最相关,但交换链接不大可能,因此可以考虑与你的生意链中的上下游合作伙伴,包括分销商,代理商,供应商等的网站交换链接。
容易被找到的相关网站
如那些做搜索引擎广告的网站或其它大力宣传推广的网站,以及自然排名不错的相关网站。
找到以上网站之后,再对其进行链接分析,考察是否属于高质量链接对象。诸如流量 ALEXA 排名、PR 值高低和导出链接的数量都是考察的基本条件。最好为对方提供链接的 HTML 源代码信息,这样链接交换对象只需简单复制这些代码并嵌入自己网页即可。注意,由于你的网站可以通过好几个不同的 URL 达到。比如下面这四个 URL 地址都指向新竞争力的主页:
http://jingzhengli.com/
http://www.jingzhengli.com
http://jingzhengli.com/index.htm
http://www.jingzhengli.com/index.htm
但搜索引擎的链接分析系统视它们为四个完全不同的页面。因此,在交换链接时必须提供一个统一的 URL,一般以符合大多数人群使用习惯的 http://www.yourname.com 为准。
交换链接的过程,是经过对对方网站仔细分析后,通过诚恳的一对一的联系最终获得,而不是漫天撒网的垃圾邮件轰炸来请求交换链接。
3、 网站被主动链接或转载:
这是最获搜索引擎赏识的链接,也是搜索引擎重视外部链接的根本原因。如果你的网站内容丰富,质量高,其它相关网站会主动将你的网站链接到他们的网站。尤其当你的网站提供很多相关免费资源、知识库时,被其它网站链接和转载的机会都很高。
4、 在重要网站发表专业文章:
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名,或在作者简介中放上你的链接和围绕关键字的网站描述。这样也是既可以获得高质量互惠链接,亦可能获得目标客户。在你的博客日志或个人主页上也不要忘了加上网站链接。注意你发表的每篇文章标题都应该包含关键词在内。
何谓重要网站,指那些流量高,威信度高的网站。个人体会是,可以用你网站的关键词去主流搜索引擎订阅新闻,那些被作为新闻源的网站都被搜索引擎看作重要网站。搜索引擎对这些新闻源每天检索一次,更新频繁,这些网站上的链接自然也成为被更新的对象,效果极佳。
5、 在所在行业目录提交网站
尽可能向更多的相关网络目录、行业目录、商务目录、黄页、白页提交你的网站,加入企业库。
工具推荐:
查询网站有哪些导入链接及数量:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA 排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测 10 个搜索引擎的收录情况)
www.seotoolkit.co.uk/link_popularity_checker.asp
搜索框命令:在 google 中输入:link:www.yourname.com
在 Yahoo 中输入:link:http://www.yourname.com 导出链接和内部链接
导出链接就是你的网站中指向其它网站的链接。搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。最后,一个网站内页面间的链接也被纳入链接分析之中,影响到网站的页面等级,最终影响排名。
导出链接:
在你的网站上如果增加一些与你关键词有关的行业/专业的资源性网站链接,不仅有利于丰富网站内容,也有利于提升搜索引擎对你网站的好印象。
这一点尤其值得一些站长注意。由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的导出链接是很有必要的。
当然,导出不同于导入,即使主题相关,也要控制数量。因为从“网页级别”的角度看,搜索引擎认为一个页面奉献的导出链接数量越多,则该网站其它页面的受益相应就减少。所以一个页面导出链接数量应受到合理控制,不要超过 15 个。首页的导出链接更要控制在10个以内,多出的应单独安排在次级页面。Google 认为一个页面的最大导出链接数量不应超过 100 个。
内部链接:
除了导入导出链接,一个站点的页面之间也往往彼此链接,如一篇文章结束后的“相关文章”列表,将该网站中同一主题下的其它文章都链接在内,不仅方便访问者,也有利于搜索引擎。网站应有意识将重要内容页面对次链接于其它页面,让搜索引擎知道这是你的重要页面,从 而给予更高的 PR 值,进行重点索引。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围主站,对提高排名相当有利。
无论是导出链接还是内部链接,都要保证链接有效而不是死链接,死链过多不仅给用户造成不便,也极不利于搜索引擎友好,影响排名。
附:免费链接检测工具:
1、 Xenu:http://home.snafu.de/tilman/xenulink.html
2、 W3C:http://validator.w3.org/checklink
关键词链接文本及上下文语意
搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都最好兼顾到链接文本中含有关键字。比如导出链接最好选择那些有关键词命名的网站,如一个服装厂商的网站可以在行业资源中添加名称中带有“服装”二字的导出链接。
需要注意的是,如果一个网站的导入链接的文本完全相同,则可能遭致搜索引擎忽略或惩罚。因为搜索引擎希望导入链接是别人自然创建的,这种统一文字使搜索引擎怀疑该网站是为了增加链接广度而进行人为制造的结果。因此网站在对外交换友情链接时最好使用不同的文本,如新竞争力的链接文本就包括“新竞争力”“网络营销管理顾问”“深圳竞争力科技公司” 等。
除了链接文本,链接周围的文字即上下文(Context) 语意也非常重要。链接分析系统通过检查链接上下文内容来确定网站与其链接对象之间的关联度,以评估该页面的内容质量。通过语意分析,也可以判断出关键词是否作弊。
搜索引擎优化作弊(七)
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,未有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段提供成功的可能性。因此在 SEO 的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。
SEO 作弊手段
做 SEO 必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、 隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、 重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascript或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、 偷换网页:
也称“诱饵行为(Bait-&-Switch)”,是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page)
指同一个网址下对不同的访问者选择性返回不同的页面内:,搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入“链接工厂”(亦称“大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。一个站点加入 “链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。
搜索引擎优化作弊
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,未有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段提供成功的可能性。因此在 SEO 的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。
SEO 作弊手段
做 SEO 必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、 隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、 重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascript或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、 偷换网页:
也称“诱饵行为(Bait-&-Switch)”,是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page)
指同一个网址下对不同的访问者选择性返回不同的页面内:,搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入“链接工厂”(亦称“大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。一个站点加入 “链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。
搜索引擎对作弊的处罚
由于作弊行为完全背离了搜索引擎对搜索结果排名的初衷——对用户有利的原则,破坏了正常的搜索结果,严重影响搜索引擎质量和声誉,并昭示出搜索引擎技术的漏洞,因此作弊行为被搜索引擎厂商深恶痛绝。一旦被侦破为作弊,将视情节轻重给予不同程度的处罚。发生在2005年3月底的Google清理部分垃圾性搜索结果(清理“广告位出租”的SEO垃圾)以及关闭部分作弊情节严重的作弊站长网站事件,就是典型的处罚案例。
搜索引擎技术的发展也是侦破作弊技术的发展。今天,搜索引擎对于蒙蔽它的手段识别技术越来越精,过去可能还行得通的手段在今天就有着被处罚的危险。以下是部分搜索引擎对于作弊行为的处罚:
百度:
根据网页的作弊情况,会受到不同程度的惩罚。
较轻微的惩罚,是系统在给网页排名时略为降低该网页的排名。
较常见的惩罚,是作弊网站的某些关键词(或所有关键词)的排名降到其它任何网站之后。
较严厉的惩罚,对于作弊行为和后果特别恶劣的网站,将从百度中消失。
特别补充,含恶意代码或恶意插件等用户极端反感内容的网页,虽然不是作弊,但只要用户投诉,一经确认也会被百度拒绝收录。
中搜:
中搜采用多种方法惩罚作弊。封杀、只索引部分正常内容(不减权)、整个网页排序推后、连带责任。
根据历史纪录,中搜有作弊黑名单,黑名单中的网站是重点防范、监控对象;根据作弊监控算法计算出来分值很高的网站也会被重点审查。
有轻微作弊的基本正常网页,中搜会只收录正常内容,如隐含文字等内容不建索引。
有较多作弊特征的网页会被减权,基本上在前几页没有机会出现。
包含有指向作弊网页的链接的网页会被牵连,承担连带责任。
中搜会搜索引擎技术的各个环节监控作弊,同时重点监控排序剧变的网页,网站不分大小、不分领域、部分亲属远近都受到每周7*24小时的监控。除自动监控系统外,还有一个人工监控小组打击作弊。
Google:
Google 没有明确给出处罚条款,但站主通过以下情况可以了解到网站是否受到处罚:
网站的 PageRank 变为“0”
Google 工具栏上的 PageRank 指示为“0”
网站在 Google 的外部链接数变为“0”
Google 工具栏上的 Backlinks 或在 Google 搜索框中键入“link:www.yourdomain.com”命令显示没有外部链。
网站排名骤降
以核心关键词搜索,原有的排名下降明显。不过这种情况有时候是算法更新的原因,与处罚无关。
网站在 Google 中消失
直接输入网址,找不到该网站。
被处罚的网站一般情况下如果解除作弊,还是可以获得“新生”,情况特别严重者除外。
附:向 Google 举报作弊网站:www.google.com/contact/spamreport.html (Googe 的反作
弊技术发展就是基于这类举报中出现的案例)
向百度投诉垃圾网页 http://www.baidu.com/search/spamreport.html
网页级别(PageRank)及因素
Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分, PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础。
网页级别概述
Google对网页级别的描述
“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它网页的“重要性”。
重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。”
PR值算法原理
总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值。
影响 PR 值的因素
PR 值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、 网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
加入搜索引擎分类目录
与已经加入目录的网站交换链接
获得来自 PR 值不低于 4 并与你的主题相关或互补的网站的链接
你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
与你交换链接的网站具有很少导出链接
与内容质量高的网站链接(PR 值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于“一个网页的重要性被平均的传递到它所引用的网页”,因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、 搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR 越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。
附:查询网站收录页面数量:在搜索引擎中输入:site:www.yoursite.com(如果输入:
site:yoursite.com,则获得的是在yoursite.com域名下所有二级域名的网页数量)。
工具推荐: www.marketleap.com/siteindex 可获得网站在多个主流搜索引擎中的网页收录数
4、首页PR的高低
尽管对PR的界定是针对网页而不是网站,但由于每个网页都依托某一网站而存在,首页是推广的核心页面,所以网站首页PR高低对内页各PR也产生直接影响。一般而言,一个网站各页面的PR值呈现以下走向:首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR降低1-2个档次。更深层次可能就无法列入评级范围了。当然,如果一个深层内页有很多外部或内部链接,情况则另当别论。
5、文件类型
Google 可以索引到的网页和文件类型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、 wri、swf。做成 PDF 格式的文件往往都是网站比较重要的内容或文章。因此 Google 默认 PDF 格式文件的 PR 天生为 3,高于一般 HTML 文件。同理,Google 给予 XML、PS、Word、Power Point、Excel 等类型页面的 PR 也比普通网页文件高。因此,对于网站比较有价值的内容,建议做成 PDF 格式。
6、 PR 值的更新:
Google 每个月进行一次彻底的数据更新(Dance),更新后的网站排名和导入链接都会有某些变化,但其 PR 更新时间一般要延迟至 dance 后三个月左右,而且网站的 PR 值相对稳定,要上升或下降一级 PR 是很不容易的事情。
工具推荐:
查看 PR 值是否处于更新期间:www.seochat.com/seo-tools/future-pagerank (如果结果出现不一致的情况,则处于更新期间)
PR 值的作用
由于网页级别的高低直接受链接的影响,而链接仅是 SEO 的一个方面,因此 PR 的高低只能反映出 SEO 的部分效果。一个网页如果拥有高 PR 值能够说明的仅是:
网页比较重要,拥有了排名靠前的优先权,并不能与排名靠前直接划上等号
具有了获得高质量导入链接的谈判优势
搜索引擎会加快对网页数据的更新
看上去挺美
正因为具有了排名靠前的优先权和谈判优势,使得高 PR 网站往往最终确实产生高排名,业内不少人士就干脆直接将 PR 与 SEO 划等号,这不仅不正确,也不利于 SEO 实施。因为 PR 值不高的网站同样有可能获得好的排名,而 PR 高的不见得有理想的排名。并且,在这样的思想指导下,人们往往片面追求链接效应,忽略了 SEO 对于内容、结构、关键词等方面的分析和改进,而后者才是用户和搜索引擎长期关注的焦点。网络营销专家冯英健博士认为:PR值的高低应该是包括 SEO 在内的搜索引擎营销所产生的自然结果而不应作为追求的目标。
结论:在 SEO 的过程中,不能忘记内容建设,不能忘记优质外链,但忘掉 PR 可没什么大不了的。
搜索引擎优化管理
如果说搜索引擎优化体现在网站建设和推广的每一个环节,则对搜索引擎优化的管理贯彻于网站推广和维护的长期过程中。在搜索引擎技术不断发展,排名算法不断更新,同行竞争越来越激烈的背景下,任何一个排名的领先或落后都是暂时的现象,没有一劳永逸的结果。只有长期坚持的、优秀的 SEO 管理,才是保持排名优势的不二法门。
搜索引擎优化诊断分析
获得专业的搜索引擎优化诊断分析报告,可以使搜索引擎营销策略更有效。新竞争力 www.jingzhengli.cn 公司特别开发出高效的搜索引擎优化诊断分析系统。该诊断指标体系由电子商务博士冯英健自行研究的 68 项评价指标构成,是国内目前最权威的搜索引擎优化评价体系。将搜索引擎优化诊断分析报告配合新竞争力开发的网站专业性评价系统,可以全方位透彻了解网站的网络营销表现,还可以针对存在的问题获得专家的分析建议。
专业顾问服务推荐:新竞争力搜索引擎优化诊断分析报告 www.jingzhengli.cn/youhua.htm
另外,新竞争力还开发了一个网站搜索引擎优化在线诊断工具,这一诊断工具是免费的,不过在本书发布时这一在线诊断系统仍在测试之中,预计 2005 年 4 月底前后正式发布,届时您可以通过下列网站中的相关介绍获得搜索引擎优化在线诊断的有关信息:
搜索引擎优化 www.sem123.com
深度网络营销 www.jingzhengli.com
新竞争力 www.jingzhengli.cn
作者的 BLOG:www.impics.com
Google 沙盒效应(Sandbox Effect)
关于Google沙盒现象,业界众说纷纭。基本上可以这样理解:这是Google对于那些刚发布不久就有良好排名的“可疑”站点置于某种屏蔽程序中进行一段时期的“隔离审查”。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和PR值。这段时长可能延续3个月左右。之所以出现沙盒现象,主要是 Google针对过度进行SEO——尤其采用了作弊手段如“制造”大量导入链接而获得高排名的网站采取的防备措施。因此,如果你的网站在发布不久后以核心关键词在Google排名中出现由高走低的不稳定现象,多半是被Google请进了沙盒。当然,还有一种观点认为:Google为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新发布的网站更多“关照”,使得新网站暂时获得排名优势;但随着Google数据更新不断加快,这种对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容,提高内容质量,获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
网站数据更新
网站经营者都希望发布的重要内容如新产品信息或重要新闻被蜘蛛快速抓取并出现在搜索结果中。但现今我们点击搜索结果中的链接,往往进入后发现内容与结果描述不同,这是因为搜索到的结果是搜索蜘蛛在上次光顾该网站时抓取到的信息,之后该页内容更新,蜘蛛程序却还没有来得及抓取,从而造成的搜索结果与实际内容不符。不过,各搜索引擎都在加快对网站访问的频率,除了每月一次全面的深度检索,还对频繁更新的网站进行数天甚至每天简单检索一次,以保证搜索结果的时效性。总结起来,Google 对网站信息的更新取决于以下因素:
1、网站自身的更新频率
一个长期没有更新的网站,无论是用户和蜘蛛程序都会减少对它的访问。可以说,更新越频繁,蜘蛛程序光顾越多,你的新信息出现在搜索结果首页的机会也越大,被抓取到的网页数量也越多。
2、网站的结构
如果一个网站拥有优化的结构,蜘蛛访问起来很顺利的话,那么它会更乐意访问该网站。
3、服务器的性能
如果蜘蛛程序前来索引你的网站,而你的服务器迟迟不能加载页面,或根本不能访问,那么搜索引擎就会尝试在下一次更新时再来,如果多次出现同样的情况,搜索引擎就会减少对该站的访问,或将它在数据库里删除。
4、PR 值的高低
正如高 PR 值拥有了获得高排名的优势,很多业内人士认为 PR 值的高低同样是搜索引擎判断更新频次的重要因素。
5、Meta“revisit-after”
有人在 Meta 中如下设置:<META NAME="revisit-after" C>,以次提示蜘蛛程序每 5 天访问一次。实际上,由于 Google 基本上已经将 Meta 所起的作用降到很低,因此类似标签是没有多大作用的。但是,如果将时间设为 30 天以后的数值,被认为是有效的。
综上所述,网站维护得力,才是搜索引擎经常更新网站数据的根本原因。
Google Dance
Google 有 8 个数据中心,共享超过一万台的服务器。一般在每月中下旬开始升级数据库。这期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。由于每次升级都会引起很多网站排名波动,俗称 Google Dance。有人则直接把 Google Dance定义成 Google 重新安排它的搜索结果排名的过程。
Google Dance 对于 SEO 来说,涉及的注意事项如下:
1、 网站的提交及更新时间
在 Dance 期间,新网站被收录的机会增大,因此宜在 Dance 其间提交新网站及加大网站更新力度。
2、 静观其变,及时跟进
由于数据调整有一个过程,Dance 期间的普遍表现是排名波动不稳定,忽上忽下。也可能在这期间调整排名算法。宜在 Dance 结束后,针对排名升降结果和竞争对手的排名情况调整自己的 SEO 策略。
工具推荐:
检查是否出现 Google Dance:www.webrankinfo.com/english/tools/Googledance.php
也可以简单地在以下地址输入同样的关键词进行查询:www.google.com、www2.google.com、www3.google.com。如果出现不同数量的搜索结果,则说明 Google 正在经历 Dance。
网站流量分析
网站流量统计分析是网站运营和维护的基础工作。在分析访问数据的基础上对网站内容及营销策略进行调整,以期获得更好的营销效果,是进行流量分析的最终目的。获取网站访问统计资料通常有两种方法:一种是通过在自己的网站服务器端安装统计分析软件来进行网站流量监测;另一种是采用第三方提供的网站流量分析服务。
对 SEO 来说,流量分析中有两个重要统计指标:访问来源(Referrer)和搜索使用的关键词,即用户通过哪些链接进入自己的网站,以及通过哪些关键词找到自己。这些链接可能是各大搜索引擎,可能是某些导入链接,也可能就是你发布在某网站上的文章的 URL;而关键词分析则可以了解哪些关键词及组合能带来访问量。这样就对网站的链接及关键词需要强化和弱化的方面了如指掌。
网站访问数据分析对 SEO 的指导是多方面的。但由于市面上大部分流量统计软件目前仅停留在统计数据的罗列上,缺乏对营销指导的结论性报告,因此这些模式化的分析结果实际上只是半成品,还需要网络营销专业人士对这些原始数据进行深度剖析,其对于 SEO 的指导作用才能真正发挥出来。
专业服务推荐:
新竞争力网站访问统计分析:www.jingzhengli.cn/fenxi.htm (可获得访问数据对网络营销的指导意义)
SEO 工具/系统
借助一些小工具或网站系统,可以高效、及时地检测、分析网站优化和运营情况,从而指导运营维护工作的深入开展。
搜索引擎及目录免费登录入口:
Google:http://www.Google.com/intl/zh-CN/add_url.html
百度:http://www.Baidu.com/search/url_submit.htm
搜狐:http://db.sohu.com/regurl/regform.asp?Step=REGFORM&;class=
网易:http://seek.163.com/cgi-bin/search/add_url.cgi
新浪:http://bizsite.sina.com.cn/newbizsite/docc/index-2jifu-09.htm
一搜:http://www.yisou.com/search_submit.html?source=yisou_www_hp
雅虎中国目录:http://cn.Yahoo.com/docs/info/suggest.html (分类目录)
DMOZ 目录:http://dmoz.org/World/Chinese_Simplified (分类目录)
英文搜索引擎自动提交:http://www.trafficzap.com/searchsubmit.php
域名与主机工具:
域名批量查询:http://www.whois.sc
IP 转换成域名:http://www.whois.sc/members/reverse-ip.html (查看某 IP 地址下共享哪些域名。免费注册)
关键字工具:
Google AdWords 关键字工具:查询特定关键词的常见查询及扩展匹配
https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度
http://www2.baidu.com/inquire/dsquery.php
搜狐关键字工具:关键字搜索热度
http://db.sohu.com/regurl/pv_price/query_consumer.asp
网易关键字工具:关键字搜索热度
http://adpsearch.163.com/find_price.php
Overture 关键字使用频率工具(英文):特定关键词的常见查询及被查询次数
http://inventory.overture.com/d/searchinventory/suggestion
关键字密度检查(英文):频繁出现的关键词及其密度
www.seotoolkit.co.uk/keyword_density_analyser.asp
内容与结构检测工具:
新竞争力网站专业性评价:www.jingzhengli.cn\pingjia.htm (基于数千网站研究获得的
120 项评测指标)
蜘蛛程序模拟器:模拟蜘蛛可抓取到的文本及链接
www.webconfs.com/search-engine-spider-simulator.php
www.spannerworks.com/seotoolkit/spider_viewer.asp
URL 检测工具:检测网站 URL 结构、无效链接等
下载地址: www.wuyue.cn/soft/XENU.ZIP
http://validator.w3.org/checklink
相似页面检测器:对比两个页面间的相似度,来判断是否有受到惩罚的危险
www.webconfs.com/similar-page-checker.php
链接广度检测工具:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA 排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测 10 个搜索引擎的收录情况)
www.seotoolkit.co.uk/link_popularity_checker.asp
www.123promotion.co.uk/directory/index.php(检查网站是否登录多个重要分类目录)
SEO 效果检测工具:
http://www.jingzhengli.com/
排名监测工具:网站以某一关键词在搜索引擎中的排名。
www.cleverstat.com/Google-monitor.htm(查 Google 排名)
www.trafficzap.com/keyrank.php (查 Google、Yahoo 排名)
(注:由于排名检测占用了本来可以用来响应用户请求的服务器资源,违反了 Google 服务
条款。因此 Google 强烈要求不要使用排名检查工具。)
查看网页级别:
Google 工具栏下载:http://toolbar.google.com (PageRank 值)
www.trafficzap.com/pagerank.php (PageRank 值)
www.seochat.com/seo-tools/future-pagerank(查看 PR 值是否处于更新期间)
www.digitalpoint.com/tools/webrank (Yahoo 的 WebRank 值)
查看 ALEXA 网站访问量全球排名:
ALEXA 工具栏下载:http://download.alexa.com/index.cgi?p=Dest_W_b_40_T1
www.trafficzap.com/sitepopularity.php
选择正规 SEO 服务商
为了在短期内把客户网站排名“做上去”从而收费,一些低质 SEO 服务商们不惜采用种种危险的作弊手段,并制造出大量的垃圾链接和垃圾结果,不仅败坏了正规 SEO 的行业名声,也搅乱了整个市场。对此,Google 特在网站向网站管理员提供的信息中,针对选择“搜索引
擎优化服务商”有如下告诫:
您可以通过某些迹象来判断是否正在与不道德的 SEO 打交道。下面所列出的只是其中很少的一部分,因此,只要有任何疑虑,您都应当相信您的直觉。 如果 SEO 具有以下行为,一定要想尽办法果断摆脱它:
拥有影子域名(即域名重定向)
在桥页上放置指向其他客户的链接
出售在地址栏中输入关键字的功能
对实际搜索结果和搜索结果中的广告不加区分
保证排名,但只依靠随意可得的晦涩冗长的关键字词组
使用多个别名或伪造的 WHOIS 信息(域名注册信息)
从“虚假的”搜索引擎、间谍软件 (spyware) 或变脸软件 (scumware) 获取点击量
自身的域名或者所拥有的域名已从 Google 索引中删除,或者在 Google 的索引中没有被列出。(原文见 Google 官方网站:www.google.com/intl/zh-CN/webmasters/seo.html)
结束语:
无论如何,不要作恶——Don’t be evil!
参考资料
[1] http://www.google.com
[2] http://spiderseo.com.cn/