• SEO 伪静态和真静态的区别


    一、伪静态的用处
    有些用户觉得,伪静态和真静态实际被收录量会相差很大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?估计很难看得出,因为所谓静态的意思,就是地址中不带问号,不带问号的就是静态,管他是真的还是伪的?搜索引擎看得出吗?所以说,其实不论是真的还是伪的,其实对于搜索引擎来说都是一样的,搜索引擎没有说,你这个是伪的,我不收录你。
    追根究底来说,为什么搜索引擎会不收录带问号的网址?因为搜索引擎怕由于问号而进入死循环,称为“搜索机器人陷阱(Spidertraps)”(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以很多时候带问号的地址搜索引擎是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有真静态比伪静态收录得多的说法。


    二、为什么选择伪静态?
    有很多用户说:真静态不好吗?为什么不用真静态?访问起来不是更快吗?负载不是更好吗?等等等等。。。。。。
    在这里,其实只用一个问题来回答:为什么选择MYSQL?很多用户大概不明白为什么那么多大型论坛都选择了MYSQL数据库作为储存机制,大概大部分都是想:“因为DZ用了MYSQL,所以就是MYSQL”。
    其实不然,试想DZ为什么会在那么多论坛程序并存的日子生存下来并笑傲江湖,很大原因是因为DZ用了MYSQL。试想如果大C当年改的程序是一个文本论坛,那还会有DZ的今天吗?或者从另一个角度问,为什么那么多大型网站都选择了MYSQL而不是文本作为储存机制?
    所谓文本论坛,实际就跟真静态的说法差不多了,将数据储存在空间上面,大量读写硬盘,等等。。。。。。
    为什么这种写法会被淘汰呢?我相信答案不会是老师所说的:“Discuz!目前有 2129867 篇帖子,存储成html的话大约是 20799M,也就是 20G左右。这当中还不计算由于磁盘存储机制造成的空间浪费(100个 1k的文件占用的空间可能会是200K)。”
    这种说法从我个人观点来看,这个理由不能给用户不使用真静态充分的理由。然而,另一个理由却是值得我们注意思考的,也是为什么绝大多数站都不选择生成静态:
    “删除、更新这些html内容会导致大量的磁盘io操作以及大量的磁盘碎片。”
    正如上面的说法,在实际当中确实会导致大量的磁盘I/O操作(input/output),大量进行I/O操作带来的后果可想而知,会产生大量的磁盘碎片甚至会导致硬盘出现坏道。
    所以对于生成静态而言,还不如去用文本论坛,可以更好的解决你们的需求。(副W就是做文本论坛出生的,当时的名字为ofstar,后因发展困难转为MYSQL,而PW生成静态页面也就是PW以前文本方式稍加改进用于吸引用户眼球的噘头)
    当然,如果大家记忆力好的话,应该可以记得PW4的时候PW论坛不能访问很长一段时间,后来恢复到一段时间前的数据,官方的说法是被人攻击而导致硬盘损坏,其实这种说法是比较不可信的,相对于是被攻击导致硬盘损坏还是大量I/O操作而产生的后果,我个人更倾向于后者。
    当然,如果大家比较关注5d6d的话,应该知道前几天有一天时间5d6d无法访问,根据非官方消息是因为硬盘坏了,而损坏的原因我想当然是因为大量用户大量进行I/O操作了,试想,我们一个论坛,进行磁盘I/O操作的仅为管理员进行更新缓存时进行的,而5d6d每一个会员就是一个管理员,试想下对磁盘是多大的考验?所以我并不奇怪5d6d的硬盘坏了。
    当然,也许在读这篇文章的很多朋友都有使用过BT,也听说过BT对硬盘很伤,不能开多,而所谓伤害,和这里指的都是同一样东西,大量I/O导致磁盘出现碎片甚至出现磁盘坏道。

    这里都是说些很实际的例子来说明问题了。


    三、伪静态的坏处
    当然犹如一篇文章的作者所说的:"如果流量稍大一些使用伪静态就出现CPU使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的ISS数是1000。”
    确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由CPU来判断了,所以CPU占有量的上升,确实是伪静态最大的弊病。

    四、我们应该选择伪静态还是真静态?
    我们来总结一下:
    1、使用真静态和假静态对SEO来说没有什么区别
    2、使用真静态可能将导致硬盘损坏并将影响论坛性能
    3、使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷
    4、最重要的一点,我们要静态是为了SEO
    所以:
    1、使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的。
    2、既然真伪静态的效果一样,我们就可以选择伪静态了。
    3、但是伪静态大量使用会照成CPU超负荷。
    4、所以我们只要不大量使用就可以了。
    5、既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用。
    6、所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了。
    7、谢谢大家耐心看我写的文章。
    8、有何不解的地方或是有不同的看法欢迎提出。

    五、关于伪静态和真静态的评论
    真正的静态化和伪静态还是有本质的区别的。为浏览用户处理一个纯粹htm和一个调用多个数据的php在CPU的使用率方面明显前者少。记得原来有个人说html下载硬盘读写频繁,他这么说好像读取数据库不用读写磁盘似的,何况还有一大堆缓存的零散php也是放在硬盘的,这些读取不用磁盘操作么?可笑。
    读取单个htm+图片Flash等附件就可以实现的目的,何苦要读数据库又要读php缓存文件又要重新整合数据输出再+图片Flash等附件这么大费周章呢?CMS首页不需要很多的互动的,论坛那一套不应该拿到这里来用,相反应该更多考虑的是:美观!兼容!信息的直观!性能!还有稳定!

    其实所谓的伪静态页面,就是指的URL重写,在ASP.NET中实现非常简单
    首先你要在你的项目里引用两个DLL:

    • ActionlessForm.dll
    • URLRewriter.dll

       真正实现重写的是 URLRewriter.dll   但是如果你要实现分页,那么必须使用这个ActionlessForm .dll
    首先在web.config里写

    <configSections>
           <section name="RewriterConfig" type="URLRewriter.Config.RewriterConfigSerializerSectionHandler, URLRewriter" />
    </configSections>
    <httpModules>
           <add type="URLRewriter.ModuleRewriter, URLRewriter" name="ModuleRewriter" />
    </httpModules>
    <!-- 下面是配置重写URL规则 -->
    <RewriterConfig>
           <Rules>
             <RewriterRule>
               <LookFor>~/Products/Jurisdiction_(\w{3})\.aspx</LookFor>
               <SendTo>~/En/Jurisdiction.aspx?jurid=$1</SendTo>
             </RewriterRule>
    
             <RewriterRule>
               <LookFor>~/Articles/(\d{1,})\.aspx</LookFor>      <!-- 这个是被代替后的文件名,使用到正则表达式 -->
               <SendTo><![CDATA[~/En/Article_view.aspx?article_id=$1]]></SendTo>      <!-- 这个是要给代替的网页,一般是带有问号后面带参数的网页 -->
             </RewriterRule>
             <RewriterRule>
               <LookFor>~/Articles/(\d{1,})_(\d{1,})\.aspx</LookFor>
               <SendTo><![CDATA[~/En/Article_view.aspx?article_id=$1&page=$2]]></SendTo>
             </RewriterRule>
          </Rules>
    </RewriterConfig>

    这样比如上面的网址http://localhost/En/Article_View.aspx?article_id=9就可以用http://localhost/Articles/9.aspx来代替,当然,你代替后的扩展名可以用任何iis能解释的扩展名,如果你喜欢用htm做扩展名,那么在配置转发规则上面配置为htm为扩展名的,同样有些文章可能很长,往往我们会把一个文章分成几页,那么根据上面的配置,我们如果想访问http://localhost/En/Article_View.aspx?article_id=9&page=3我们就可以用http://localhost/Articles/9_3.aspx来代替,这样当搜索引擎来抓起你的网页的时候,就会收录你这些网址下去,别人搜索到你网页的时候,就可以从这些地址链接过来。
    然后这样操作:
                       右键点我的电脑-->管理-->展开'服务和应用程序'-->internet信息服务-->找到你共享的目录-->右键点击属性 -->点击'配置'-->
    映射下面 -->找到.aspx的可执行文件路径 复制路径-->粘贴路径-->扩展名为".html"-->然后把检查文件是否存在的勾去掉 这样就可以了

    补充:
    首先在以下地址:
    http://download.microsoft.com/download/0/4/6/0463611e-a3f9-490d-a08c-877a83b797cf/MSDNURLRewriting.msi
    下载 MS 的 URLRewriter.dll,放到你的web程序的bin下。
    注:以上地址下载的是微软的一个完整的 URLrewrite 技术示例。下载后是一个 MSDNURLRewriting.msi 文件,安装在本地机上,安装后,在安装目录内有三个文件夹,分别是:ActionlessForm ,RewriterTester,URLRewriter 这三个目录。 其中 URLRewriter 文件夹便是一个完整的 URLRewrite 的项目示例。此项目中的 BIN 目录中有两 个 dll,分别为
    ActionlessForm.dll 和 URLRewriter.dll ,这两个 dll 就是项目 ActionlessForm 和 URLRewriter 产生的 dll 类库,是示例项目 RewriterTester 实现 URLRwrite 技术所用到的类库文件。
    如何把此技术应用到你自己的项目中去,其实很简单:
    首先,把 ActionlessForm.dll 和 URLRewriter.dll 两个 dll 文件放到你自己项目中的 bin 目录下。
    然后,修改你的 web.config 文件,完整的 web.config 文件如下:
    (只需在普通的 web.config 文件中填加两个地方)
    ----------------------------------------------
    1、
    在 </configSections> 标签上面填加:

    <section name="RewriterConfig" type="URLRewriter.Config.RewriterConfigSerializerSectionHandler, URLRewriter" />

    2、

    <httpModules>
        <add type="URLRewriter.ModuleRewriter, URLRewriter" name="ModuleRewriter" />
    </httpModules>

    然后,你的 aspx 程序就会按照你 web.config 文件中的 正则表达式,转换url 请求地址,实现 urlrewrit 技术。

    比如:
    1、http://localhost:4789/GuanTestURLRewrit/2003/07/18.aspx 
    按照 web.config 文件中的正则,此 url 地址为被 重写到以下真实存在的地址
    http://localhost:4789/GuanTestURLRewrit/ShowBlogContent.aspx?year=2003&month=7&day=18" target="_blank">http://localhost:4789/GuanTestURLRewrit/ShowBlogContent.aspx?year=2003&month=7&day=18
    2、http://localhost:4789/GuanTestURLRewrit/2003/default.aspx
    按照 web.config 文件中的正则,此 url 地址为被 重写到以下真实存在的地址
    http://localhost:4789/GuanTestURLRewrit/ShowBlogContent.aspx?year=2003
    3、http://localhost:4789/GuanTestURLRewrit/Products/Confections.aspx
    按照 web.config 文件中的正则,此 url 地址为被 重写到以下真实存在的地址
    http://localhost:4789/GuanTestURLRewrit/ListProductsByCategory.aspx?CategoryID=3
    可以自己定义自己的正则表达式实现不同的 url 重写规则
    如果您想把 aspx 重写成 html 后辍名,那么则需要改动一下你的 web.config 文件,

    <httpHandlers>
        <add verb="*" path="*.aspx" type="URLRewriter.RewriterFactoryHandler, URLRewriter" />
        <add verb="*" path="*.html" type="URLRewriter.RewriterFactoryHandler, URLRewriter" />
    </httpHandlers>

    这样好像还不行,那是因为在IIS里面无法解析.html后缀名(具体我也不知道怎么叫...)

    然后这样操作:
    右键点我的电脑-->管理-->展开'服务和应用程序'-->internet信息服务-->找到你共享的目录-->右键点击属性 -->点击'配置'-->
    映射下面 -->找到.aspx的可执行文件路径 复制路径-->粘贴路径-->扩展名为".html"-->然后把检查文件是否存在的勾去掉 这样就可以了
    引用 ActionlessForm.dll 文件,是因为当页面中有Post数据(如Post文本)。那么这时重写后的URL就会变为:http://localhost/Test/2004/12/News.aspx?ID=12 真实的 url,露出原始的地址了,这显然是不完善的,
    附:为什么URL就会变为:http://localhost/Test/2004/12/News.aspx?ID=12
    其实很简单,因为在web.config中有这样的一句:

    <SendTo>~/Default.aspx?ID=$2</SendTo>

    在没有替换form之前,你查看页面的源码就可以看到,你的form的Action是到(以上面的例子):Default.aspx?ID=12

    即.aspx页面最后生成的HTML是:

    <form id="Form1" name="Form1" method="post" action="Default.aspx?ID=12"></form>

    解决方述问题方法:

    首先把ActionlessForm.dll拷入你的项目中的bin目录,然后在你的VS.net的项目中引用这个dll。再在你原有的(即没重写的).aspx页面中
    第一步:把这句加于代码顶部:

    <%@ Register TagPrefix="skm" Namespace="ActionlessForm" Assembly="ActionlessForm" %>

    第二步:

    <form id="Form1" method="post" runat="server"></form>

    替换成:

    <skm:Form id="Form1" method="post" runat="server"></skm:Form>

    这样,当此页面有回发数据时,则不会跳到真实的 url 上去。

  • 相关阅读:
    poi管道流的导入导出
    Mysql导入数据库的方法
    MySQL数据库指定字符集
    eclipse 的操作
    Mysql的操作
    第十周作业
    第九周作业
    第八周作业
    第七周作业
    第六周作业
  • 原文地址:https://www.cnblogs.com/masahiro/p/10131233.html
Copyright © 2020-2023  润新知