来源:心理测试
SEO人员必须知道:搜索引擎要解决什么问题,有哪些技术上的困难,有什么限制,搜索引擎又怎样取舍。
SEO人员优化网站就是减少搜索引擎的工作量、降低搜索引擎的工作难度,使搜索引擎能更轻松、快速地收录网站页面,更准确地提取页面内容。
搜索引擎指的是由蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库挑选出符合搜索关键词要求的页面。蜘蛛的爬行、页面的收录及
排序都是自动处理。
网站目录则是一套人工编辑的分类目录,由编辑人员人工创建多个层次的分类,站长可以在不同分类里提交网站,目录编辑在后台审核所提交的网站,将网站放置于相应的分类页面。有的时候编辑也主动收录网站。
典型的网站目录包括雅虎目录、开放目录、hao123等。
目录对SEO最大的意义是建设外部链接,像雅虎、开放目录、hao123等都有很高的权重,可以给被收录的网站带来一个高质量的外部链接。
搜索引擎主要会面对以下几方面的挑战:
1、页面抓取抓取需要快而全面
一些网站并不利于搜索引擎蜘蛛爬行和抓取,诸如网站结构的缺陷、大量使用Flash、JavaScript脚本,或者把内容放在用户必须登录以后才能访问的部分,都增大了搜索引擎抓取内容的难度。
2、海量数据存储
3、索引处理快速有效,具有扩展性
4、查询处理快速准确
5、判断用户意图及人工智能
搜索结果显示格式:
搜索结果页面主体有两部分最主要,一是广告,二是自然搜索结果。右侧广告最多有8个,上部广告可以多至3个。
搜索广告在网络营销行业经常称为PPC,由广告商针对关键词进行竞价,广告显示广告商无须付费,只有搜索用户点击广告后,广告商才按竞价价格支付广告费用。PPC是搜索营销的另一个主要内容。
经典搜索结果列表:
主要分三部分:
第一行页面标题,通常取自页面html代码中的标题标签。这是结果列表中最醒目的部分,用户点击标题就可以访问对应的网页。可见页面标题标签的写法,无论对排名还是对点击率都有重要意义。
第二、第三行是页面说明:页面说明有的时候取自页面HTML中的说明标签(Description Tag),有时从页面可见文字中动态抓取相关内容。显示什么页面说明文字是用户查询时才决定的。
第四行显示三个信息,最左侧是网址,用户可以看到页面来自哪个网站,以及目录文件名信息;中间是百度数据库中页面最后更新的日期;最后是百度快照链接,用户可以点击快照,查看存储在百度数据库中的页面
内容,当页面被删除或者其他技术问题导致不能打开网站,用户至少还可以从快照中查看想要的内容。
搜索引擎工作原理简介:
搜索引擎的工作过程大体上可以分成三个阶段:
1、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码入数据库。
2、预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
3、排名:用户输入关键后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页。