€ (euro) 标记 是一个 3 字节字符,在 (UTF-8)中这个字符被表示为 0xE2, 0x82, 0xAC。
有时候,你的系统中没有设置所有的地方为相同的字符集的时候(Confluence,服务器和数据库都应该是相同的字符集),你可能会遇到一些字符不能显示的问题。
...
I write a page with a Euro sign in it (€). All is well, the Euro sign shows up in the wiki markup text-box, and the preview, and the display of the saved page.
One day later, the Euro sign has changed into a question mark upside down!
...
What is going on? Why does the Euro sign mysteriously change? How do I prevent it?
有趣的是,这个字符集在测试的时候是没有问题的,Confluence 和数据库都能够没有问题的完整识别这个字符。
导致这个问题的可能是有如下 2 个原因:
数据库和 Confluence 使用的是 utf-8 编码,但是连接不是。
当数据在应用程序和数据库之间进行传递的时候,如果使用的不是 utf-8 编码,有可能会导致字符不能被识别。你可以在你的连接中指定使用 utf-8 编码,你这个问题将会自动被解决,请注意修改数据库连接后,已经存在的数据不会被修改,你可能需要找到有乱码的地方自行进行修改。
数据库没有使用 utf-8,但是 Confluence 和连接使用的是。
如果你的数据库编码没有使用 UTF-8 编码,例如你可能使用的是 latin1 编码,那么有可能在你存储 "€" 字符的时候导出存储错误。这个有可能是因为 缓存(caching) 导致的。 当 Confluence 将数据库存储到数据库的时候,Confluence 有可能还保留了一个本地的缓存拷贝。如果数据库的字符集没有被正确的设置,欧元的标记可能不能在数据库中正确存储,但是 Confluence 有可能会持续使用缓存的数据(这个数据有正确的编码)。这个错误只能在缓存被删除后才能察觉到,因为不正确的字符编码已经存储到数据库中了。
针对存储使用 latin1 编码的字符集,所有 2 字节的 UTF-8 编码字符都应该能够正确显示,在存储欧元标记的时候,数据库中的存储数据将会显示为 '?' 。Confluence 的字符编码被设置为 UTF-8 编码,那么 2 字节的 UTF-8 编码,在数据库中存储的使用的 latin1 字符集,那么数据库也会使用的是 2 字节的字符集而不会使用 UTF-8 字符集。这样 3 自己的字符集,例如欧元就不能正确存储了。
请确定你按照你系统的建议为你的所有的实体都设置 UTF-8 编码,请参考 Troubleshooting Character Encodings 页面中内容。