Search English Optimization,搜索引擎优化,简称为SEO。
(1)网站结构布局优化:尽量简单
1. 控制首页链接数量:首页链接不能太多,一旦太多,没有实质性的链接,很容易影响用户体验,也会降低网站首页的权重,收录效果也不好。
2.扁平化的目录层次:让爬虫工具不要跳转太多,一般三次就可以就能到达网站内的任何一个内页。
3.导航优化:导航应该尽量采用文字方式,也可以搭配图片导航,但是图片代码一定要进行优化,<img>标签必须添加“alt”和“title”属性,告诉搜索引擎导航的定位,做到即使图片未能正常显示时,用户也能看到提示文字。
4. 网站的结构布局:页面头部:logo及主导航,以及用户的信息。
页面主体:左边正文,包括面包屑导航及正文;右边放热门文章及相关文章,好处:留住访客,让访客多停留,对“蜘蛛”而言,这些文章属于相关链接,增强了页面相关性,也能增强页 面的权重。
页面底部:版权信息和友情链接。
特别注意:分页导航写法,推荐写法:“首页 1 2 3 4 5 6 7 8 9 下拉框”,这样“爬虫”能够根据相应页码直接跳转,下拉框直接选择页面跳转。而下面的写法是不推荐的,“首页 下一页 尾页”,特别是当分页数量特别多时,“爬虫”需要经过很多次往下爬,才能抓取,会很累、会容易放弃。
5.控制页面的大小,减少http请求,提高网站的加载速度:一个页面最好不要超过100k,太大,页面加载速度慢。当速度很慢时,用户体验不好,留不住访客,并且一旦超时,“爬虫”也会离开。
(2)网页代码优化
1、<title>标题:只强调重点即可,尽量把重要的关键词放在前面,关键词不要重复出现,尽量做到每个页面的<title>标题中不要设置相同的内容。
2、<meta keywords>标签:关键词,列举出几个页面的重要关键字即可,切记过分堆砌。
3、<meta description>标签:网页描述,需要高度概括网页内容,切记不能太长,过分堆砌关键词,每个页面也要有所不同。
4、<body>中的标签:尽量让代码语义化,在适当的位置使用适当的标签,用正确的标签做正确的事。让阅读源码者和“爬虫”都一目了然。比如:h1-h6 是用于标题类的,<nav>标签是用来设置页面主导航的等。
5、<a>标签:页内链接,要加 “title” 属性加以说明,让访客和 “爬虫” 知道。而外部链接,链接到其他网站的,则需要加上 el="nofollow" 属性, 告诉 “爬虫” 不要爬,因为一旦“爬虫”爬了外部链接之后,就不会再回来了。
6.正文标题要用<h1>标签:“爬虫” 认为它最重要,若不喜欢<h1>的默认样式可以通过CSS设置。尽量做到正文标题用<h1>标签,副标题用<h2>标签, 而其它地方不应该随便乱用 h 标题标签。
7、<br>标签:只用于文本内容的换行。
8、表格应该使用<caption>表格标题标签
9、<img>应使用 "alt" 属性加以说明
10、<strong>、<em>标签 : 需要强调时使用。<strong>标签在搜索引擎中能够得到高度的重视,它能突出关键词,表现重要的内容,<em>标签强调效果仅次于<strong>标签。
<b>、<i>标签: 只是用于显示效果时使用,在SEO中不会起任何效果。
11、文本缩进不要使用特殊符号 应当使用CSS进行设置。版权符号不要使用特殊符号 © 可以直接使用输入法,拼“banquan”,选择序号5就能打出版权符号©。
12、巧妙利用CSS布局,将重要内容的HTML代码放在最前面,最前面的内容被认为是最重要的,优先让“爬虫”读取,进行内容关键词抓取。
13、重要内容不要用JS输出,因为“爬虫”不认识
14、尽量少使用iframe框架,因为“蜘蛛”一般不会读取其中的内容
15、谨慎使用 display:none :对于不想显示的文字内容,应当设置z-index或设置到浏览器显示器之外。因为搜索引擎会过滤掉display:none其中的内容。
16、不断精简代码
17、js代码如果是操作DOM操作,应尽量放在body结束标签之前,html代码之后。