• 浅说搜索引擎和SEO


    搜索引擎
      基本工作原理
      信息收集功能
      技术点
    SEO优化核心
      优化重点
      SEO优化
        网站URL
        title信息
        meta信息
        图片ALT
        flash信息
        frame框架
      网页重要度特征

      之前有看到一个师兄的个人博客做得很漂亮、每次打开百度后直接搜索该师兄的名字,该博客每次都排列在第一位,很神奇的事情,要知道关于SEO在很多人看来都是一门大学问。故特此简单学习一下搜索引擎的基本知识和SEO,希望能对这方面有所了解!

    搜索引擎

    基本工作原理

    搜索引擎的基本工作原理包括以下三个过程: 
      1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫,爬虫通过超链接从一个网站爬到另外一个网站,通过超链接分析连续访问抓取更多网页,被爬取得网页被称为网页快照。 
      爬虫抓取网页的常用策略: 
    a.深度优先、b.宽度优先、c.权重优先(层次的多与少;连接的外链多少与质量)、d.重访抓取(全部重访;单个重访) 
      2、处理网页。抓取到了网页后,引擎还要做大量的预处理工作,如数据分析、建立索引库等,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其中还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度和复杂度等。 
      数据处理: 
    a.网页结构化(删除html代码,提取内容)、b.消噪(留下网页的主题内容)、c.查重(查找重复的页面删除)、d.分词(将内容分为N个单词,排列,存进索引库)、e.链接分析(计算链接权重) 
      3、提供检索服务。由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档和查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。

    信息收集功能

    搜索引擎的自动信息收集功能分为两种:

    • 定期搜索(如Google一般为28天,主动搜索提取网站信息和网址加入自己的数据库)
    • 提交网站搜索(网站拥有者主动向搜索引擎提交网址,在一定时间内定向向你的网站进行搜索) 
      当用户以关键字查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法–通常根据网页中关键词的匹配程度、出现位置、频次,链接质量等,计算出个网页的相关度和排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

    技术点

      搜索引擎设计的技术点:技术点主要集中在处理网页和抓取网页部分:如查询处理、排序算法、页面抓取算法、CACHE机制、ANTI-SPAM等等。

    SEO优化核心

      SEO:Search Engine Optimization,搜索引擎优化。简单来说就是提高网站搜索友好度、使网站搜索排名提高。

    优化重点

      1、网站的程序架构要尽量保持简洁,去除花销的代码,可以尝试JS调用。搜索引擎优化本身就与用户体验相通相倚,相互结合,除此之外,繁琐的代码不但会影响网站页面的加载速度,让用户体验降低。 
      2、做足站内SEO的细节功夫。从大范围上讲,是要对程序进行趋简洁化的修正,而细节来说,就是在URL静态化、title、keyword、description的写法,keyword已经不被搜索引擎投以任何的重视。 
      3、做足站外SEO的方方面面。包括交换友情链接的注意和做普通外链时候应该如何操作、控制等,切勿想着走捷径,想着群发外链或者一次性购买大量高权重外链。这些都是SEO的错误思维和策略。我们一般推荐大家做一般性传统SEO。 
      4、用户体验。在搜索引擎上获得排名的原因是因为我们为用户提供了有价值的内容。从发展角度去看,我们都应该朝着做用户、做产品、做服务的方面去发展。

    SEO优化

    网站URL

      网站创建具有良好描述性、规范、简单的url,有利于用户更方便的记忆和判断网页的内容,也有利于搜索引擎更有效的抓取你的网站。 
      处理方式:

    • 在系统中只使用正常形式URL,不让用户接触到非正常形式的URL。
    • 不把session id、统计代码等不必要的内容放进URL中。
    • 不同形式的URL,301永久跳转到正常形式。
    • 防止用户输错而启动的备用域名,301永久跳转到主域名。
    • 使用robots.txt禁止Baiduspider抓取您不想向用户展示的形式。

    title信息

      网页的title用于告诉用户和搜索引擎这个网页的主要内容是什么,而且当用户在百度网页搜索中搜索到你的网页的时候,title会作为最重要的内容显示在摘要中。搜索引擎在判断一个网页内容权重时,title是主要参考信息之一。 
      描述建议

    • 首页,网站名称,或者网站名称_提供服务介绍or 产品介绍
    • 频道页:频道名称_网站名称
    • 文章页:文章title_频道名称_网站名称 
      需要注意的是 
      1、标题要主题明确,包含这个网页中最重要的内容。 
      2、简明精炼,不罗列与网站内容不相关的信息。 
      3、用户浏览通常是从左向右的,重要的内容应该放在title的靠前的位置。 
      4、使用用户所熟知的语言描述。

    meta信息

      meta description是meta标签的一部分,位于html的区。 
      meta description是对网页内容的精简概括,如果meta description描述与网页内容相符,百度会将meta description当作摘要的选择目标之一。虽然它不是权值计算的参考因素,这个标签存在与否不影响网页权值,只会用作搜索结果摘要的一个选择目标。 
    推荐做法: 
      网站首页、频道页、产品参数页等没有大段文字可以用作摘要的网页最合适使用description。 
      为每个网页创建不同meta description,避免所有的页面都使用同样的描述。 
      长度合理,不过长不过短。

    图片ALT

      建议为图片加alt说明,因为这样可以让搜索引擎了解图片的内容。

    flash信息

      Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。 
      所以如果一定要使用flash,建议给object标签添加注释信息。 
      这些信息会被看作是对Flash的描述信息。让搜索引擎更好的了解您flash的内容。

    frame框架

      不建议使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。

    网页重要度特征

      体现网页重要度的特征有: 
      1、网页的入度大,表明被其他网页引用的次数多。 
      2、某网页的父网页入度大。 
      3、网页的镜像度高,说明网页比较热门,从而显得很重要。 
      4、网页的目录深度小,易于用户浏览到。这里定义的目录深度是指除去域名部分的目录层次。

  • 相关阅读:
    UVA11464偶数矩阵
    UVA11464偶数矩阵
    UVA11462年龄排序
    UVA11462年龄排序
    UVA11427玩纸牌(全概率+递推)
    UVA11427玩纸牌(全概率+递推)
    UVA11389巴士司机问题
    LA3644简单并查集判环
    LA3027简单带权并查集
    LA3027简单带权并查集
  • 原文地址:https://www.cnblogs.com/zhouyuqin/p/5148548.html
Copyright © 2020-2023  润新知