这个问题是在 科锐国际 工作过程中发现的
word文档的名字(有汉字和空格)在windows系统上遍历是查不到文件的,但是在linux系统上市可以的
压缩包里面的中文名word文档,如果出现汉字和空格,在压缩包打开是不需要密码的,但是如果压缩包里面的word文档为全英文,打开的就需要密码(尽管生成的时候没有设置密码)
在上面的案例中,下载打开压缩包都是在windows系统(linux系统未测试)doc文件其实本身就是一个压缩包,把word文件的后缀(docx,doc)改为zip,然后打开其实就是一个文件目录,包含相关的图片和XML文档
doc转xml其实不能用word的另存为保存,要更改word的后缀,查看原始文件获得