• 深蓝词库转换1.2版本发布——支持紫光拼音和拼音加加


    之前推出了深蓝词库转换工具,受到大家的欢迎,有朋友陆陆续续来信,希望增加一些实用的功能,于是乎今天深蓝词库转换1.2推出。该版本主要实现了3个新功能:

    1.支持紫光拼音输入法的词库导入导出。

    紫光拼音这个就不用我介绍了吧,当年搜狗拼音还没有推出之时,紫光拼音是我见过的最好用的拼音输入法了。现在紫光输入法还在不断推出新版本,同时也支持了词库的导入导出。如果想从搜狗输入法或者QQ输入法转换到紫光输入法,或者想回味一下紫光输入法,那么我想深蓝词库转换1.2的这个新功能应该能够让不少同学受益。

    以搜狗细胞词库转紫光输入法为例,选择一个下载的细胞词库,然后在目标中选择紫光输入法即可,如图:

     image

    然后在紫光拼音中导入用户词库便可,如图:

     image

    【注意:紫光拼音在导入词库时对单词的检查比较严格,所以有可能会提示出现错误,单击“是”按钮继续导入即可。成功导入的数量可能比细胞词库的条数少一点点。】

    2.支持拼音加加的词库导入导出。

    拼音加加输入法也是一个很有历史的输入法了,当年和紫光拼音不分伯仲,现在应该还是有不少用户。如果拼音加加的用户想试一试其他输入法或者想扩大自己的词库,那么这个功能一定对您有帮助。(貌似加加输入法很久很久没有更新过了o(╯□╰)o,其用户是不是该考虑下其他输入法了?)

    加加输入法的词库导出的格式与一般的输入法不同,他不标准拼音,只有是多音字的时候才只对多音字注音。我下载了加加输入法然后输入了一下词,接下来就是在拼音加加输入法的词库及自定义管理中选择“其他”选项卡中的“导出用户词库”,可以将词库导出为txt文件。如下是导出的拼音加加词库内容:

    曾ceng经的de事情
    大da尉wei
    检查cha一下
    深蓝
    我的de音乐yue
    我的de快乐le
    西安
    尉yu迟琳嘉
    查zha京
    曾zeng毅

    然后用深蓝词库转换进行词库转换,假设转换成谷歌拼音,转换结果如图所示:

    image

    3.支持批量的词库转换。

    在高级设置菜单中有一个“允许批量词库转换”选项,选中了该选项,那么就可以多选词库文件,当然多选的词库文件必须是同一种类型的词库,我相信有人肯定有很多细胞词库要转,那我就以细胞词库批量转换为例,转换成谷歌拼音输入法,如图所示:

    image

    另外,这次修复了一个Scel格式搜狗细胞词库解析的错误,分析了好久,终于把细胞词库的内部格式大部分都搞懂了,所以现在细胞词库的转换应该不会报错了。

    目前还有微软拼音输入法、智能ABC等常用的老牌输入法我还没有搞定,尤其是智能ABC,相信这是很多人的第一个拼音输入法,不知道他的词库内部是什么结构,不知道该如何解析。另外还有各种输入法中的自定义词还没有实现导入。还有什么问题或者功能需求,希望大家多提意见。

    文件下载地址:深蓝词库转换下载

    我一直将该项目开源,项目源代码在http://code.google.com/p/imewlconverter/ 

  • 相关阅读:
    机器学习常见模型以及代码实现
    vuepdf报错Cannot read properties of undefined (reading ‘catch‘))
    python环境搭建和pycharm工具下载
    filter: dropshadow和boxshadow, 用于CSS设计漂亮的阴影
    java生成A4纸pdf每一页都有表格的头部和尾部,根据表内容自动换页,table.getTotalHeight()不生效
    chrome浏览器播放rtsp格式的视频流(非转码)
    GB28181Client_WinForm
    RTSP录制AI告警视频(前后15秒)
    ubuntu 定时重启
    基于python和CV2的视频活动检测
  • 原文地址:https://www.cnblogs.com/studyzy/p/1775083.html
Copyright © 2020-2023  润新知