• C# 真正完美的 汉字转拼音


    网上有很多说自己整理的汉字转拼音是完美的,但使用后才发现都是半吊的瓶子,问题多多。

    常见的生僻字,或多音字识别,转换后简直让人感觉可怕。

    主流的转换有三种:hash匹配,Npinyin,微软PinYinConverter。

    但单用这三个,都没法做到完美,为什么没人考虑融合呢?

    我的方案:Npinyin+微软PinYinConverter(首选Npinyin)

    微软PinYinConverter

    为什么:微软PinYinConverter很强大,但在多音字面前,犯了传统的错误,按拼音字母排序。如【强】微软居然优先【jiang】而不是】【qiang】

    所以不能优选 PinYinConverter。

    Npinyin

    很人性,很不错的第三方库,在传统多音字前优先使用率较高的,但在生僻字面前有点无法转换。(GetInitials(strChinese)  有Bug  如【洺】无法识别,但GetPinyin可以正常转换。)

    总结:优先Npinyin  翻译失败的使用微软PinYinConverter。目测完美。

    上代码:

    public class PingYinHelper
        {
            private static Encoding gb2312 = Encoding.GetEncoding("GB2312");
    
            /// <summary>
            /// 汉字转全拼
            /// </summary>
            /// <param name="strChinese"></param>
            /// <returns></returns>
            public static string ConvertToAllSpell(string strChinese)
            {
                try
                {
                    if (strChinese.Length != 0)
                    {
                        StringBuilder fullSpell = new StringBuilder();
                        for (int i = 0; i < strChinese.Length; i++)
                        {
                            var chr = strChinese[i];
                            fullSpell.Append(GetSpell(chr));
                        }
    
                        return fullSpell.ToString().ToUpper();
                    }
                }
                catch (Exception e)
                {
                    Console.WriteLine("全拼转化出错!" + e.Message);
                }
    
                return string.Empty;
            }
    
            /// <summary>
            /// 汉字转首字母
            /// </summary>
            /// <param name="strChinese"></param>
            /// <returns></returns>
            public static string GetFirstSpell(string strChinese)
            {
                //NPinyin.Pinyin.GetInitials(strChinese)  有Bug  洺无法识别
                //return NPinyin.Pinyin.GetInitials(strChinese);
    
                try
                {
                    if (strChinese.Length != 0)
                    {
                        StringBuilder fullSpell = new StringBuilder();
                        for (int i = 0; i < strChinese.Length; i++)
                        {
                            var chr = strChinese[i];
                            fullSpell.Append(GetSpell(chr)[0]);
                        }
    
                        return fullSpell.ToString().ToUpper();
                    }
                }
                catch (Exception e)
                {
                    Console.WriteLine("首字母转化出错!" + e.Message);
                }
    
                return string.Empty;
            }
    
            private static string GetSpell(char chr)
            {
                var coverchr = NPinyin.Pinyin.GetPinyin(chr);
    
                bool isChineses = ChineseChar.IsValidChar(coverchr[0]);
                if (isChineses)
                {
                    ChineseChar chineseChar = new ChineseChar(coverchr[0]);
                    foreach (string value in chineseChar.Pinyins)
                    {
                        if (!string.IsNullOrEmpty(value))
                        {
                            return value.Remove(value.Length - 1, 1);
                        }
                    }
                }
    
                return coverchr;
    
            }
        }

    抽了几个常见错字和姓名

    测试如下:

     [TestMethod]
            public void PingyinTest()
            {
                Dictionary<string, Tuple<string, string>> dict = new
                    Dictionary<string, Tuple<string, string>>() {
                {"梅钰", new Tuple<string,string>( "meiyu","MY")},
                {"张洺", new Tuple<string,string>( "zhangming","ZM")},
                {"王玥", new Tuple<string,string>( "wangyue","WY")},
                {"王思琪", new Tuple<string,string>( "wangsiqi","WSQ")},
                {"董云强", new Tuple<string,string>( "dongyunqiang","DYQ")},
                {"宋红培", new Tuple<string,string>( "songhongpei","SHP")},
                {"石磊", new Tuple<string,string>( "shilei","SL")},
                };
    
                foreach (var keyval in dict)
                {
                    var name = keyval.Key;
    
                    var spell1 = keyval.Value.Item1;
                    var spell2 = keyval.Value.Item2;
    
                    var val = ChineseSpell.ConvertToAllSpell(name).TrimAll();
    
                    val = FlexLogicFramework.Library.CommonLib.PingYinHelper.ConvertToAllSpell(name)
                        .TrimAll().ToLower();
    
                    Assert.IsTrue(val == spell1, "转换错误");
    
                    val = FlexLogicFramework.Library.CommonLib.ChineseSpell.GetFirstSpell(name).TrimAll();
    
                    val = FlexLogicFramework.Library.CommonLib.PingYinHelper.GetFirstSpell(name).TrimAll();
    
                    Assert.IsTrue(val == spell2, "转换错误");
                }
    
            }
  • 相关阅读:
    [附件解决方案]CruiseControl.NET 超冷门”BUG” 关键字:VstsHistoryParser ParseChangeSet CheckForModifications FormatException
    SQL SERVER 2008 函数大全 字符串函数
    第五章 DOM接口 DOM Interfaces
    [MSSQL]FOR XML AUTO I
    DOS CHOICE命令
    [MSSQL]NTILE另类分页有么有?!
    原生态webglDEMO,以后可能选择Three.JS来代替了,代码网上找的,参考引用
    [MSSQL]COALESCE与ISNULL函数
    【转】“无法在Web服务器上启动调试。您不具备调试此应用程序的权限,此项目的URL位于Internet区域”错误提示的解决
    【转】一个项目涉及到的50个Sql语句(整理版)
  • 原文地址:https://www.cnblogs.com/shikyoh/p/6270026.html
Copyright © 2020-2023  润新知