在上一篇SEO的优化系列文章中,跟大家提及到SEO是以数据为基础开展的工作,并简单的写了一些关于准备数据的前期工作。对于Seoer而言,数据基础固然重要但它扮演的只能是辅助角色。从系统SEO工作流程中,出现问题、改进结果、决策计划等参考因素的依据,这一切都离不开东莞SEO的操作方法
什么叫做的方法?笔者个人认为,这里说的方法可以分为以下两种或者说四种:
一.让网站产生搜索引擎友好化、让网站加强对来自搜索引擎的用户友好化
谈论关于友好化问题的时候,如果我们把黑帽手段加入考虑的话,其实还可以额外加上两种方法:1.将搜索引擎误以为网站对搜索引擎友好、2.将搜索引擎误以为网站对来自搜索引擎的用户友好。相信Seoer们,自我总结之下,都会发现其实任何关于SEO的方法,都无法脱离这四点的范畴。
关于黑帽SEO并不想在这系列文章里多做讨论,仅仅以简单的文字是无法描述出要如何对搜索引擎及其用户友好的。因此本文的核心主题是:如何去让网站对搜索引擎实现友好化?
二.引导搜索引擎更准确的去识别自己的网页
无论今后搜索引擎的发展如何,除非是AI实现突破式进展,否则它永远只是一个被设置的程序。这就意味着它不可能做到太多精确的判断,毕竟它面向的是来自互联网一个远超千万级别的网页数据库。
在搜索引擎抓取的原理中,网页分析的操作属于它的日常工作之一。这个工作是把一个完整的页面文件切割成一个一个不同功能的区块。比如:文章区块、链接区块、联系区块等等。那么它判断的方式是什么呢?从字数、HTML代码形式、内容语言化处理等方式加以判断。
三.页面块化区分
在一般的HTML代码中,我们都知道<div>标签是用来标明网页中不同区块的用处,并且在不同<div>标签中又有<h2>或<h3>这样的标签来指明当前区块的作用等。其实这样的做法无非是把页面上每一个不同的内容区块通过标签标明意义。这样的工作对于搜索引擎这个程序而言,它就可以通过这样的标签意义判断每一个网页分块内容,并且通过<h2>或<h3>这样的细分标志去了解特定分块下属于什么样的内容,什么样的作用,再而进入判断阶段之后,再去考虑如何进行相关索引排名计算处理等等。
下面以 Amazon的产品信息页面为例:
从上图中我们可以明确的把这个页面归类为三个不同的内容区块,在这些内容区块中我们可以清晰看出它们分别代表的是关联产品、技术参数以及商品细节。
对比国内电商而言,最常见的是上方设置为产品图片、价格,接着在第二块区块中,将一些产品参数、相关描述等一大堆产品图片堆在一起,从上图的对比中,我们可以发现真正有意义的内容往往容易被人忽视。(如:Product Details)
当然Amazon的产品页面SEO工作,对于电商行业而言无疑是最顶尖级别的存在,其价值功能远非eBay这类网站可比。其中页面块化区分的工作同属于主要原因。
四.通俗化与语义化
这里提及的语义化指的是页面里的HTML代码,虽然这些代码对于浏览用户而言没有任何意义,但是对于搜索引擎而言,首要识别的工作内容便是来自于HTML代码(语义化对于维护者而言,同样是值得注意的一方面)
另外关于微数据以及微格式等日渐重要的概要理念,它们无疑将页面标识元素的含义重现,由于篇幅关系这里就不多作解释了,以下提供一个官方说明地址给大家:
(其实微数据更重要的一个意义可能是对于提升网页SERP的点击率。对于电商网站,以此方法提升数倍流量的效果也不是完全没有可能的)
不过微数据这样的新兴方式总会带有一定的局限性,例如:微数据无法指定主要作用区块的含义,比如:标明页面中哪个是头部、哪个是页面底部等问题。在HTML5规范出台之后,这个尴尬的问题终于得到了解决,
由于浏览器、技术人员等等问题之下,当今HTML5并没有非常的流行(对于纯粹的SEO角度来说,我们应该推动它的普及),显然目前并不可以用<header>等标签来使用,还是需要用到<div>这类标签。在这样的情况之下,我们需要注意<div>中的ID命名。因为对于搜索引擎而说:<div id=”header”>要比<div id=”toubu”> 容易理解。在一般来说,我们可以用到ID的地方,已经不需要再去用CLASS了,总有人仍然喜欢写成这样:<div class=”header”>。其实在W3C规范中已经明确的指出:“具有唯一性的元素必须使用ID命名而非CLASS”。当然对于搜索引擎而言,这个具有唯一性的元素还是可以明确识别出来的。
举个例子:某个公司里有一个PPC的着陆页面,在网页上明明正在出现的关键词,质量分数依然无法提高。通过分析之后,技术人员发现那些关键词都被写在<div class=”footer”>这个区块里,这些关键字就这样被无关内容被区分开来,让搜索引擎错误的判断分析当前的网页内容,从而对质量分造成了一定的负面影响。
关于页面的通俗化,这里说的是,不要在一个页面上用一些无法理解的指示性文字,比如说:“在搜索框附近放一个“找找看”,而不是“搜索”这样的字眼”。这样一来,会让用户造成一定的困扰,同时也可能让搜索引擎为此困扰。
因为搜索引擎还是会以自然语言结果的处理方式,去理解这样的一些文字。大致的思路大概是这原的:“随机从索引库厘抽取出1000个网页样本,然后找出页面上的搜索区块,再去通过一些机器分析出这些区块一般出现什么字眼最多”。与此相应的肯定是分析日后其它网页时,出现相同字眼的区块内容更可能是一个搜索区块。
前面提及到关于<div>,对于<div id=”header”><div id=”head”>等等,这些因为都是比较常见的,搜索引擎肯定可以因此判断它为头部区块。如果是<div id=”toubu”>或是<div id=”h_1″>这一类的,对于搜索引擎来说它就显得迷茫了。错误的区块化改造可能会错误引导搜索引擎,这样的话,最终分析得出来的结果也就不是你所想要的结果了。
笔者后记:
本文开头以引导搜索引擎友好化为例,简单的为大家介绍了如何让网站对搜索引擎友好化的工作思路。但是搜索引擎其实并不仅是单纯的分析网页、这里对于分析网页的工作,其实也远远不止上述所说的内容,这些仅仅是当作是思路拓展的另一种方式而已。
Via: