• 了解搜索引擎一


    来源:心理测试

    SEO人员必须知道:搜索引擎要解决什么问题,有哪些技术上的困难,有什么限制,搜索引擎又怎样取舍。
    SEO人员优化网站就是减少搜索引擎的工作量、降低搜索引擎的工作难度,使搜索引擎能更轻松、快速地收录网站页面,更准确地提取页面内容。
    搜索引擎指的是由蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库挑选出符合搜索关键词要求的页面。蜘蛛的爬行、页面的收录及

    排序都是自动处理。
    网站目录则是一套人工编辑的分类目录,由编辑人员人工创建多个层次的分类,站长可以在不同分类里提交网站,目录编辑在后台审核所提交的网站,将网站放置于相应的分类页面。有的时候编辑也主动收录网站。

    典型的网站目录包括雅虎目录、开放目录、hao123等。

    目录对SEO最大的意义是建设外部链接,像雅虎、开放目录、hao123等都有很高的权重,可以给被收录的网站带来一个高质量的外部链接。

    搜索引擎主要会面对以下几方面的挑战:
    1、页面抓取抓取需要快而全面
    一些网站并不利于搜索引擎蜘蛛爬行和抓取,诸如网站结构的缺陷、大量使用Flash、JavaScript脚本,或者把内容放在用户必须登录以后才能访问的部分,都增大了搜索引擎抓取内容的难度。
    2、海量数据存储
    3、索引处理快速有效,具有扩展性
    4、查询处理快速准确
    5、判断用户意图及人工智能

    搜索结果显示格式:
    搜索结果页面主体有两部分最主要,一是广告,二是自然搜索结果。右侧广告最多有8个,上部广告可以多至3个。
    搜索广告在网络营销行业经常称为PPC,由广告商针对关键词进行竞价,广告显示广告商无须付费,只有搜索用户点击广告后,广告商才按竞价价格支付广告费用。PPC是搜索营销的另一个主要内容。

    经典搜索结果列表:
    主要分三部分:
    第一行页面标题,通常取自页面html代码中的标题标签。这是结果列表中最醒目的部分,用户点击标题就可以访问对应的网页。可见页面标题标签的写法,无论对排名还是对点击率都有重要意义。

    第二、第三行是页面说明:页面说明有的时候取自页面HTML中的说明标签(Description Tag),有时从页面可见文字中动态抓取相关内容。显示什么页面说明文字是用户查询时才决定的。

    第四行显示三个信息,最左侧是网址,用户可以看到页面来自哪个网站,以及目录文件名信息;中间是百度数据库中页面最后更新的日期;最后是百度快照链接,用户可以点击快照,查看存储在百度数据库中的页面

    内容,当页面被删除或者其他技术问题导致不能打开网站,用户至少还可以从快照中查看想要的内容。

    搜索引擎工作原理简介:
    搜索引擎的工作过程大体上可以分成三个阶段:
    1、爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码入数据库。
    2、预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。
    3、排名:用户输入关键后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页。

  • 相关阅读:
    探索式测试实践之路
    管理是什么?真正的管理者是,“管”+“理”!
    JavaScript中的函数式编程
    node js的终端中 console.log 嵌套对象会被折叠的问题
    apt-get install的默认安装路径
    nodejs 事件循环 试题思考
    仅20行的JavaScript模板引擎
    js 驼峰命名转烤串
    git reset 进阶
    linux 拷贝文本到剪切板
  • 原文地址:https://www.cnblogs.com/wdkshy/p/3302463.html
Copyright © 2020-2023  润新知