第一步排除excel读取的数据是不是乱码
EXCEL读取时经常会出现乱码,而我们常用的字符集是UTF-8 ,GB2312(GBK) ,这就需要对编码进行转换,但是又不能对纯数字和英文字符转换,否则会乱码,而只要有一个中文字符时,就必须转换编码。
个人总结了下EXCEL中经常出现的数字和英文字符,写了一个正则表达式来匹配它们,当匹配成功时,不对其做转换,反之转换成GBK或者UTF-8。
/* * @param $value 从EXCEL中读取的单元格数据 * @param $toCharset 要转换成的编码,默认为UTF-8 * @return String 转换后的字符串 */ function realChar($value,$toCharset="UTF-8"){ if(preg_match("/^[0-9a-zA-Zs.-(),+*/]*$/",$value)){ return $value; }else{ return iconv("UTF-16LE",$toCharset,$value); } }
第二部排除mysql的设置字符集和自己的读取文本的字符集是否一致
mysql_query("set names 'utf8'");//设置编码输出