基于Java语言的编码问题了解
以下仅为本人工作、学习过程中所接触到的内容,不足之处欢迎指出。
近两天使用maven的tomcat插件,以及使用非插件版的tomcat部署项目时遇到了乱码问题,在解决乱码问题过程中,查阅了较多的博客材料,以下为查看到的资料中个人觉得比较好的文章,有助于从根本上了解乱码产生的原因以及解决方案。
供需要的同学及自己方便查阅
- JVM默认字符集问题 https://blog.csdn.net/zzs0829/article/details/7407598
- Java编码问题汇总 https://www.cnblogs.com/wxfvm/p/3677497.html
- java 编码与Charset.defaultCharset()问题 https://www.dazhuanlan.com/2019/10/05/5d97c7f3d115e/
- Java中弄懂Unicode和UTF-8编码方式 https://blog.csdn.net/qq_22771739/article/details/84261165
- 深入分析 Java 中的中文编码问题 https://developer.ibm.com/zh/articles/j-lo-chinesecoding/
- 字符,字节和编码 http://www.regexlab.com/zh/encoding.htm
以下为个人在解决问题过程中总结的一些拙见:
中文Windows操作系统的字符集为GBK。若启动JVM时未指定字符集,JVM会默认使用与操作系统相同的字符集,但是如果是使用IntelliJ IDEA执行Java程序,JVM很可能会使用IDEA设置的【Global Encoding】或【Project Encoding】,即此时JVM会使用IDEA设置的【Global Encoding】或【Project Encoding】作为默认字符集,而不是操作系统的字符集。