Java和C++通过Socket通信中文乱码的解决

Java和C++通过Socket通信中文乱码的解决
理想的开发状态是我开始就是C开发，一直是C的开发，现在还是C的开发，若干年后，幸运的话，我可以成为C语言的高手或者专家……

更实际的情况是我开始是C开发，后来变成了JAVA开发，然后又做起了VC++的开发，几年下来，发现自己几乎一无所长，成为了编程界的万金油，这种产物很重要，但是也比较尴尬。

前一段时间我用C开发了一个服务器程序，前端是VC开发的客户端。

现在我用JAVA开发了一个类似的服务器程序，前端依然是VC开发的客户端，运行时发现，中文乱码了。

先说说我的问题场景，很常见：
```
1 VC++客户端请求Java服务器，Java服务器从mysql数据库里读取中文字符串，然后通过Socket发送给客户端。
```
我以前也遇到编码的问题，用GBK，GB2312，UTF-8一顿乱转，竟然解决了。这次我如法炮制，各种转，都失败了。

再次感谢互联网，在网上查了不少的资料，看到了不少的说法，尝试了好多都没有成功。

即便如此，还是有不少的启发，沉下来自己去分析自己的代码，最终幸运的解决了，现在梳理一下自己的思路，希望也许某一天能帮到正在抓耳挠腮的你。

①数据库编码

我的mysql数据库的编码是默认的latin1，打开数据库，发现存储的中文字符串是乱码。这说明我存的不是latin1编码，那是什么呢？

②数据库插入

数据库中的数据是通过WEB软件插入的，查看得知插入的中文字符编码是gb2312。

③数据库访问

再看一下数据库的编码情况，在数据库中执行命令如下：
```
 1 mysql> show variables like '%char%';
 2 +--------------------------+----------------------------+
 3 | Variable_name | Value |
 4 +--------------------------+----------------------------+
 5 | character_set_client | latin1 |
 6 | character_set_connection | latin1 |
 7 | character_set_database | latin1 |
 8 | character_set_filesystem | binary |
 9 | character_set_results | latin1 |
10 | character_set_server | latin1 |
11 | character_set_system | utf8 |
12 | character_sets_dir | /usr/share/mysql/charsets/ |
13 +--------------------------+----------------------------+
```
我们需要重点关注的是以下几个配置：

| character_set_client | latin1 | 客户端的字符集

| character_set_connection | latin1 | 连接字符集

| character_set_results | latin1 | 结果字符集

可以在访问数据库时，通过发送语句【set names gb2312】设置需要的编码格式。

我没有在访问数据库时手动的设置编码，所以得到的结果集应该是latin1编码。

④编码转换

按照以上的步骤分析，就是现在我的Java程序得到的是latin1编码的字符串，我需要正确的把它编码为原始的gb2312。

感谢Java的便捷，一句话就完成了两次编码转换：
```
1 String encodeStr = new String(mysqlResult.getBytes("iso-8859-1"),"gb2312")  //latin1编码在Java中的编码标识为"iso-8859-1"。
```
此时在程序中经过打印论证了编码的正确性，能够得到WEB页面实际输入的中文字符串。

⑤Socket发送

然后我信心满满的将这个转换后的结果通过BufferedWriter发送给VC++客户端。

结果，竟然还是乱码！！！

这是为什么呢？？？

再次的查找资料，得到了结论：
```
Java通过Socket发送的字符流默认编码格式为utf-8，而VC++的Socket默认的字符接收编码方式为gb2312。
```
只需要修改Java端的Socket发送编码即可：
```
1 BufferedWriter out = new BufferedWriter(new OutputStreamWriter(clientSocket.getOutputStream(),"gb2312"));
```
OK，至此，我的VC++客户端能够正确的显示中文字符了。

如果其中我理解的原理有偏差，还望各位朋友不吝赐教。
相关阅读:
idea 快捷键
 python 之网页解析器
 python 之正则表达式
 Python Requests快速入门
 Html style="visibility:hidden"与style="display:none"的区别
 html 之table标签结构学习
 python 之format字符串格式化
 Python 时间戳和日期相互转换
 SQL 字符串函数
 xampp默认配置拿shell
原文地址：https://www.cnblogs.com/yoyotl/p/4834835.html