• 【转】终于解决了Apache乱码问题


    之前开放了一个空间,给网友提供电台节目音频下载。由于多年节目的文件数量甚多,且分类没有特定格式,图省事,没有制作网页提供分类下载,而是直接利用Apache的目录浏览功能,简单直观。

    不过,所在的美国服务器默认Apache编码设置为ISO-8859-1,使得中文文件名出现乱码,每次浏览只能手动设置一下浏览器的编码,设置为GB2312就可以正常显示了。每刷新一次都要设置一次,好是麻烦。想解决这个问题,但是找了好多资料,都没有解决到。一直就拖了将近2年了。辛苦了需要下载的网友了。

    这几天,突然有冲动,要把这个问题解决。

    首先是给DH的customer service反应了(其实以前也反应过此问题),我在提问的同时,给了一个可能的解决方案给DH,让他们协助修改http.conf,将"AddDefaultCharset ISO-8859-1"修改为"AddDefaultCharset GB2312"。迅速得到DH的回复,可惜答案并没有解决我的问题。DH不允许修改系统配置,告诉我去修改htaccess文件,看看能否解决问题。又见htaccess文件……我修改了几十次的配置文件,不过没有一次可以成功解决这个乱码问题。虽然如此,见DH热心地附上了配置参考文档(http://www.w3.org/International/questions/qa-htaccess-charset),还是挺感激的。

    之前,利用htaccess,企图解决乱码问题,尝试过以下多种指令:

    AddDefaultCharset GB2312
    DefaultLanguage zh-cn
    AddDefaultCharset none
    AddDefaultCharset Off
    AddLanguage zh-cn .cn
    AddCharset gb2312 .html
    AddCharset gb2312 .htm

    用W3的检查器检查(http://validator.w3.org/detailed.html),结果发现,对Apache的目录浏览是不起作用的。只对上传的文件(.html等等)起作用。

    经过分析,应该是由于默认的目录浏览方式是由Apache生成index文件的,因为只能在生成前设定编码。

    再仔细看了一下htaccess文件配置文档,发现Apache Module mod_autoindex(http://httpd.apache.org/docs/2.2/mod/mod_autoindex.html#indexoptions),里面有FancyIndexing项目(其实之前都用过这个设置的IndexOptions NameWidth了),IndexOptions竟然也有一个关于编码的设置,Charset=character-set,天啊!怎么之前没有看到?!一看到这个选项,就感觉已经接近解决乱码问题了。

    立刻修改htaccess文件,加入

    IndexOptions Charset=GB2312

    重新打开网页,成功!用W3的检查器检查,也是显示编码为GB2312!终于解决了!

  • 相关阅读:
    hive基本操作与应用
    理解MapReduce计算构架
    熟悉HBase基本操作
    熟悉常用的HDFS操作
    爬虫大作业
    数据结构化与保存
    使用正则表达式,取得点击次数,函数抽离
    爬取校园新闻首页的新闻
    网络爬虫基础练习
    Hadoop综合大作业
  • 原文地址:https://www.cnblogs.com/jacklikedogs/p/3498988.html
Copyright © 2020-2023  润新知