• CentOS 7中的系统语言包及UTF-8、en_US.UTF-8和zh_CN.UTF-8的区别


    UTF-8、en_US.UTF-8和zh_CN.UTF-8的区别

    en_US.UTF-8、zh_CN.UTF-8叫做字符集,就是说‘A’、‘B’、‘中’、‘国’等对应的整数值,
    en_US.UTF-8只包含了ASCII码,zh_CN.UTF-8包含了6000多个汉字?
    如果是这样的话,那所谓UTF-8,就是把这些整数,编写成一串字节的方法?

    UTF-8 是编码方式

    en_US.UTF-8 和 zh_CN.UTF-8 是语言环境,也就是字符集

    en_US.UTF-8 和 zh_CN.UTF-8 包含的字符数量是基本上一样的,大概是七万个汉字,编码都是 UTF-8 编码,字符集是 Unicode,版本是 4.1 吧?zh_CN.GB18030 和 zh_CN.GBK 的字符集都与 Unicode 3 是等价的,记得应该是这样
    语言环境的差别就是另一回事了,中国人和外国人表示时间啦,数字啦,习惯都不一样,所以必须区分开。大部分程序根据语言环境变量来选择界面的语言是中文还是英文。

    所以一般linux系统的语言环境设置成:export LANG=zh_CN.UTF-8,代表中国人使用的unicode字符集

     查看默认语言

    [root@localhost ~]$ cat /etc/locale.conf <-----之前的 /etc/sysconfig/i18n 已变为 /etc/locale.conf
    
      LANG=en_US.UTF-8​​​<------默认是英
     或 [root@localhost​~]$ echo $LAN

     查看系统已安装的语言包

    $ locale
     LANG=en_US.UTF-
     LC_CTYPE="en_US.UTF-8
     LC_NUMERIC="en_US.UTF-8
     LC_TIME="en_US.UTF-8
     LC_COLLATE="en_US.UTF-8
     LC_MONETARY="en_US.UTF-8
     LC_MESSAGES="en_US.UTF-8
     LC_PAPER="en_US.UTF-8
     LC_NAME="en_US.UTF-8
     LC_ADDRESS="en_US.UTF-8
     LC_TELEPHONE="en_US.UTF-8
     LC_MEASUREMENT="en_US.UTF-8
     LC_IDENTIFICATION="en_US.UTF-8"​​<-------装的都是英文包 ,没有安装中文

    临时修改默认语言

    [root@localhost​~]$ LANG="zh_CN.UTF-8"​​<----临时设置默认语言为中文,前提是安装了中文语言

    永久修改语言包

      1 、安装中文语言包:

    [root@host ~]# yum install -y kde-l10n-Chinese

     2 、安装 glibc-common(如果已经安装过,则需要重新安装):

      先检查是否已经安装 glibc-common :

    [root@host ~]# yum list installed | grep glibc-common
    或者
    [root@host ~]# rpm -qa | grep glibc-common

    如果已经安装过,则需要重新安装,这样才能利用上第一步的中文语言包:

    [root@host ~]# yum reinstall -y glibc-common

    如果没有安装过,那么安装即可:

    [root@host ~]# yum install -y glibc-common

    3 、查看系统是否支持中文语言包:

    [root@host ~]# locale -a | grep zh

    4 、修改配置文件,再重启服务器即可:

    [root@host ~]# echo 'LANG="zh_CN.UTF-8"' > /etc/locale.conf
    [root@host ~]# reboot
     

    查看文件编码及修改文件编码

     [root@localhost​~]$ enca filename​​​​<--- 没有这个命令请安装​ sudo yum install -y enc


     需要说明一点的是,enca对某些GBK编码 的文件 识别的不是很好,识别时会出现
     Unrecognized encodin
     在Vim中查看文件编码

     :set fileencodin

     如果想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以
     ~/.vimrc 文件 中添加以下内容
     set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp93
     这样,就可以让vim自动识别文件 编码 (可以自动识别UTF-8或者GBK编码 的文件 ),其实就是依照 fileencodings提供的编码 列表尝试,如果没有找到合适的编码 ,就用latin-1(ASCII)编码 打开

     在Vim中直接进行转换文件编码 ,比如将一个文件 转换成utf-8格
     :set fileencoding=utf-

     用命令enconv 转换文件编码

     enconv -L 原编码 -x 新编码 filename
     例如: enconv -L zh_CN -x UTF-8 filenam


     用命令iconv 转换文件编码

     iconv -f 原编码 -t 新编码 filenam
     例如:iconv -f encoding -t encoding filenam


     用命令convmv 转换文件名编码:​​<-----此命令常用于解决Linux文件拷贝到Windows后文件名乱码的问
     convmv -f 原编码 -t 新编码 [选项] filenam
     常用参数
     -r 递归处理子文件 
     --notest 真正进行操作,请注意在默认情况下是不对文件 进行真实操作的,而只是试验
     --list 显示所有支持的编
     --unescap 可以做一下转义,比如把 变成空
     注意:该命令只转换文件名编码,文件内容不
     不要在NTFS和FAT文件 系统中使用此命令,否则可能产生意外结果,如果要在Linux 中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法查看一下man手册

    参考:https://ccie.lol/knowledge-base/linux-centos-7-install-chinese

             https://www.iteye.com/blog/825635381-2087814

             https://zhuanlan.zhihu.com/p/58655288

  • 相关阅读:
    recognizer = cv2.face.LBPHFaceRecognizer_create() AttributeError: module 'cv2.cv2' has no attrib
    pixijs mask 注意的问题
    Windows下关闭node进程的方法(指令版)
    设计原则和思想:规范与重构
    极客时间趣谈网络协议第五模块 底层网络知识详解:陌生的数据中心 总结
    设计原则和思想:设计原则
    设计原则和思想:面向对象
    LINUX系统:ORCLE数据库密码过期修改
    dlopen重复打开的一些问题
    Ubuntu18搭建kafka单机集群
  • 原文地址:https://www.cnblogs.com/guanbin-529/p/12846345.html
Copyright © 2020-2023  润新知