汉字转拼音-pypinyin模块

最近遇到一个问题，需要将一批中文用户名转换成拼音，网上查了一下，有两个模块可以使用，pypinyin和xpinyin模块，用起来也很方便。

一、pypinyin模块

1、安装

pip3 install pypinyin

2、转换

from pypinyin import pinyin
print(pinyin('张三'))
[['zhāng'], ['sān']]

可以看到结果是一个二维列表，每个元素都是一个列表，并且包含了每个字的读音。

如果是多音字，比如 “朝阳”，默认只能识别其中一个读音
from pypinyin import pinyin
print(pinyin('朝阳'))
[['zhāo'], ['yáng']]

如果想要显示多个读音的话，只需添加 heteronym参数并设置为True：
from pypinyin import pinyin
print(pinyin('朝阳', heteronym=True))
[['zhāo', 'cháo'], ['yáng']]

3、其实多数情况下我们是不需要管多音字的，我们只是用它来转换一下名字而已，而处理上面的二维数组又比较麻烦，那么可以使用lazy_pinyin这个方法来生成

from pypinyin import lazy_pinyin

name_list = [
    '张三',
    '李四',
    '小六子'
]

for name_zh in name_list:
    # 将每个中文汉字转换成拼音，组成列表
    name_pinyin_list = lazy_pinyin(name_zh)
    # print(name_pinyin_list)
    '''
    ['zhang', 'san']
    ['li', 'si']
    ['xiao', 'liu', 'zi']
    '''
    name_pinyin = ''
    # 将拼音拼接到一起
    for i in name_pinyin_list:
        name_pinyin += i

    print(name_pinyin)
    '''
    zhangsan
    lisi
    xiaoliuzi
    '''

二、xpinyin模块

from xpinyin import Pinyin

p = Pinyin()  # 实例拼音转换对象
re1 = p.get_pinyin('小姐姐真可爱',tone_marks=None,splitter=' ') #转换，不显示声调，使用空格作为分隔符。
#其中tone_marks指定是否带声调，默认为None；splitter指定分隔符，默认为'-'。

re2 = p.get_pinyin('小姐姐真可爱',tone_marks='marks',splitter=' ') #转换，显示声调。
re3 = p.get_pinyin('小姐姐真可爱',tone_marks='numbers',splitter=' ') #转换，显示声调数字。

p.get_initials("小姐姐真可爱",splitter=' ') #获取首字母
print(re1,re2,re3)  #打印

相关阅读:
如何利用京东云的对象存储（OSS）上传下载文件
2017年4月8日Office 365 使用CSV文件导入邮件组
在Office 365 的如何给管理员赋予查看所有人邮箱的权限的Powershell
Office 365 Powershell 连接命令
Office365创建通讯组
国际版删除域名的步骤
如何停止AAD服务
导出Office365中的组及成员
AWS/阿里/Azure，云厂商价格大PK
OA系统与Exchange 日历打通

原文地址：https://www.cnblogs.com/dxnui119/p/14660751.html