utf8 全包容了gbk ,并不是说超集和子集;
8i 的数据库 的 utf8 是 4位定长的字符编码;
9i 和以上数据库的utf8 有4位定长AL32UTF8和 不定长的 UTF8 ,都是unicode编码;
其中,utf8 编码中 字符大多是三字节的编码,一个汉字是 3字节的编码;
zhs16gbk 并不是unicode 编码,只是提供了对gbk汉字编码的支持, 一个汉字为双字节;
utf8 对于 zhs16gbk 中的所有编码都有唯一的编码以之对应,所以我说utf8 全包容了bgk;
当然,utf8作为一种unicode 编码,他还提供 global character 的支持;
假如设置得当,从 zhs15gbk 到utf8 是可以实现无损耗的字符转换的;
本人从事汉字冷僻字处理相关的工作,对此还是比较了解的;