• CentOS系统下中文文件名乱码


    从windows上传到linux的文件或者目录,在Linux系统中显示为乱码。虽然将Linux的env设置了LANG=en_US.UTF-8,并且本地的Shell客户端编码也设置成UTF-8,但在Shell中(或通过http访问),仍是乱码……

    原因在于,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

    安装方式1:wget http://pkgs.repoforge.org/convmv/convmv-1.15-1.el6.rf.noarch.rpm
    rpm -ivh convmv-1.15-1.el6.rf.noarch.rpm

    安装方式2:yum install convmv

    语法:
    convmv [options] FILE(S) ... DIRECTORY(S)
    主要选项:
    1、-f ENCODING
    指定目前文件名的编码,如-f gbk
    2、-t ENCODING
    指定将要转换成的编码,如-f utf-8
    3、-r
    递归转换目录下所有文件名
    4、--list
    列出所有支持的编码
    5、--notest
    默认是只打印转换后的效果,加这个选项才真正执行转换操作。

    常用参数:
    -r 递归处理子文件夹
    –notest 真正进行操作,默认情况下是不对文件进行真实操作
    –list 显示所有支持的编码
    –unescap 可以做一下转义,比如把%20变成空格
    -i 交互模式(询问每一个转换,防止误操作)
    convmv 的使用方法:
    convmv -f 源编码 -t 新编码 [选项] 文件名

    使用:/usr/bin/convmv -f gbk -t utf-8 -r --notest /home/wwwroot(要转码的文件夹)

    inux下有许多方便的小工具来转换编码:
    文本内容转换 iconv
    文件名转换 convmv
    mp3标签转换 python-mutagen

    例子:

    这样转换以后“GBK编码的文件名”会被转换成UTF-8编码(只是文件名编码的转换,文件内容不会发生变化)。

    注意:不要在NTFS和FAT文件系统中使用此命令,否则可能产生意外结果,如果要在Linux中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法参考man手册。

    例子1:
    1.递归转换centos目录下的目前文件名编码gbk为utf-8:
    convmv -f gbk -t utf-8 --notest -r centos

    列子2:
    convmv -f GBK -t UTF-8 --notest -r mirrors.zzsir.cn/*
    (mirrors.zzsir.cn/*为要转编码的文件的当前目录)

    例子3
    convmv -f GBK -t UTF-8 --notest *.zip
    把当前目录以.zip结尾的文件批量转码

  • 相关阅读:
    Linux 如何通过命令查看一个文件的某几行(中间几行或最后几行)
    linux 定义变量 ,添加变量值
    Linux下的vi编辑命令中查找·替换详解
    linux vi 块操作、多窗口
    linux 磁盘 分区、格式化、挂载
    linux 重名名、删除文件操作
    linux vi
    linux 文件查阅 cat、more、less、tail
    linux ls touch、umask、 chattr
    linux 目录配置
  • 原文地址:https://www.cnblogs.com/jasonlam/p/7928179.html
Copyright © 2020-2023  润新知