从windows上传到linux的文件或者目录,在Linux系统中显示为乱码。虽然将Linux的env设置了LANG=en_US.UTF-8,并且本地的Shell客户端编码也设置成UTF-8,但在Shell中(或通过http访问),仍是乱码……
原因在于,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。
安装方式1:wget http://pkgs.repoforge.org/convmv/convmv-1.15-1.el6.rf.noarch.rpm
rpm -ivh convmv-1.15-1.el6.rf.noarch.rpm
安装方式2:yum install convmv
语法:
convmv [options] FILE(S) ... DIRECTORY(S)
主要选项:
1、-f ENCODING
指定目前文件名的编码,如-f gbk
2、-t ENCODING
指定将要转换成的编码,如-f utf-8
3、-r
递归转换目录下所有文件名
4、--list
列出所有支持的编码
5、--notest
默认是只打印转换后的效果,加这个选项才真正执行转换操作。
常用参数:
-r 递归处理子文件夹
–notest 真正进行操作,默认情况下是不对文件进行真实操作
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格
-i 交互模式(询问每一个转换,防止误操作)
convmv 的使用方法:
convmv -f 源编码 -t 新编码 [选项] 文件名
使用:/usr/bin/convmv -f gbk -t utf-8 -r --notest /home/wwwroot(要转码的文件夹)
inux下有许多方便的小工具来转换编码:
文本内容转换 iconv
文件名转换 convmv
mp3标签转换 python-mutagen
例子:
这样转换以后“GBK编码的文件名”会被转换成UTF-8编码(只是文件名编码的转换,文件内容不会发生变化)。
注意:不要在NTFS和FAT文件系统中使用此命令,否则可能产生意外结果,如果要在Linux中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法参考man手册。
例子1:
1.递归转换centos目录下的目前文件名编码gbk为utf-8:
convmv -f gbk -t utf-8 --notest -r centos
列子2:
convmv -f GBK -t UTF-8 --notest -r mirrors.zzsir.cn/*
(mirrors.zzsir.cn/*为要转编码的文件的当前目录)
例子3
convmv -f GBK -t UTF-8 --notest *.zip
把当前目录以.zip结尾的文件批量转码