1 所有一个音只有一个字列表
a : [('未分类', '厑')] ca : [('cà', '遪'), ('未分类', '乲')]
cang : [('càng', '賶'), ('未分类', '濸')]
ceng : [('cēng', '噌'), ('cèng', '蹭')]
chai : [('chǎi', '茝')]
chen : [('未分类', '烥')]
cheng : [('未分类', '鯎')]
chi : [('未分类', '麶')]
chou : [('未分类', '鮘')]
chua : [('chuā', '欻')]
chuai : [('chuái', '膗'), ('chuǎi', '揣')]
ci : [('未分类', '閊')]
cun : [('cùn', '寸'), ('未分类', '籿')]
cuo : [('cuǒ', '脞')]
da : [('dǎ', '打')]
dao : [('dáo', '捯')]
de : [('dē', '嘚')]
dei : [('dēi', '嘚'), ('děi', '得')]
deng : [('未分类', '艠')]
di : [('未分类', '嚸')]
dia : [('diǎ', '嗲')]
dian : [('未分类', '椣')]
die : [('diè', '哋'), ('未分类', '幉')]
dong : [('未分类', '鶫')]
dou : [('dóu', '唞'), ('未分类', '乧')]
duan : [('duǎn', '短')]
dui : [('duǐ', '頧')]
en : [('ěn', '峎'), ('èn', '摁')]
eng : [('ēng', '鞥'), ('未分类', '椧')]
er : [('ēr', '乻')]
fang : [('fàng', '放'), ('未分类', '堏')]
feng : [('未分类', '琒')]
fo : [('未分类', '梻')]
fou : [('fóu', '紑')]
gao : [('未分类', '吿')]
gen : [('gén', '哏'), ('gěn', '艮')]
geng : [('未分类', '椩')]
gu : [('gú', '鹘')]
gua : [('未分类', '颪')]
guai : [('guái', '叏')]
gui : [('未分类', '櫷')]
ha : [('hà', '哈')]
hai : [('未分类', '塰')]
hang : [('未分类', '垳')]
hao : [('未分类', '竓')]
hen : [('hèn', '恨')]
heng : [('héng', '鵆')]
hou : [('hōu', '齁')]
hu : [('未分类', '粐')]
jian : [('jián', '暕')]
jiang : [('未分类', '櫤')]
jie : [('未分类', '桝')]
jing : [('未分类', '橸')]
ju : [('未分类', '﨔')]
jue : [('juè', '倔')]
kang : [('káng', '扛')]
kao : [('未分类', '廤')]
kua : [('未分类', '舿')]
kuai : [('未分类', '圦')]
kuan : [('未分类', '鑧')]
lai : [('lǎi', '襰'), ('未分类', '萙')]
lang : [('lāng', '啷')]
lei : [('lēi', '勒'), ('未分类', '矋')]
leng : [('lēng', '棱'), ('lěng', '冷')]
li : [('lī', '哩')]
lia : [('liǎ', '俩')]
lie : [('liě', '裂'), ('未分类', '挘')]
lin : [('līn', '拎')]
lou : [('未分类', 'o')]
luan : [('luǎn', '卵')]
luo : [('未分类', '鮱')]
mai : [('未分类', '蕒')]
man : [('未分类', '襔')]
mao : [('未分类', '毟')]
men : [('mēn', '闷'), ('未分类', '椚')]
miao : [('miāo', '喵')]
mie : [('未分类', '旀')]
ming : [('mìng', '命'), ('未分类', '掵')]
mou : [('mōu', '哞'), ('mǒu', '某')]
nan : [('未分类', '遖')]
nao : [('nāo', '孬')]
ne : [('né', '哪')]
neng : [('néng', '能')]
ni : [('nī', '妮')]
nian : [('未分类', '焾')]
nie : [('nié', '苶')]
nin : [('nǐn', '拰'), ('未分类', '脌')]
niu : [('niū', '妞'), ('niù', '拗')]
nong : [('nǒng', '繷')]
nou : [('nóu', '羺'), ('未分类', '鯑')]
nu : [('未分类', '莻')]
nuan : [('nuán', '奻')]
nun : [('nún', '黁')]
o : [('ō', '噢'), ('ó', '哦')]
pa : [('未分类', '巼')]
pai : [('pāi', '拍'), ('未分类', '闏')]
pan : [('pǎn', '坢')]
pao : [('pǎo', '跑')]
pei : [('pěi', '俖'), ('未分类', '蓜')]
peng : [('未分类', '輧')]
pi : [('未分类', '迲')]
pie : [('piè', '嫳')]
pin : [('未分类', '朩')]
ping : [('pǐng', '屛'), ('未分类', '岼')]
qia : [('qiá', '拤')]
qie : [('qiē', '切'), ('qiě', '且')]
qiong : [('qiōng', '銎'), ('qióng', '嬛')]
qu : [('未分类', '衐')]
que : [('qué', '瘸')]
rang : [('rāng', '嚷')]
reng : [('rēng', '扔'), ('rèng', '艿')]
rong : [('未分类', '穃')]
rou : [('rǒu', '韖')]
ruo : [('未分类', '嵶')]
sai : [('未分类', '嗮')]
san : [('未分类', '壭')]
sang : [('sàng', '丧')]
sao : [('未分类', '乺')]
se : [('sē', '閪')]
shai : [('shǎi', '色')]
shan : [('未分类', '圸')]
shao : [('shǎo', '少'), ('未分类', '蕱')]
shei : [('shéi', '谁')]
shou : [('shóu', '熟')]
shua : [('shuǎ', '耍')]
shuai : [('shuǎi', '甩')]
shun : [('shūn', '楯'), ('shǔn', '吮')]
si : [('sǐ', '死')]
su : [('sú', '俗'), ('未分类', '苆')]
suan : [('suǎn', '匴')]
sui : [('未分类', '荽')]
sun : [('sùn', '潠')]
tai : [('tǎi', '呔')]
tao : [('tào', '套')]
teng : [('tèng', '霯')]
tian : [('未分类', '鴫')]
ting : [('tìng', '梃')]
tou : [('tòu', '透')]
tui : [('未分类', '燵')]
tun : [('tǔn', '氽'), ('tùn', '褪'), ('未分类', '饨')]
tuo : [('未分类', '鵇')]
wa : [('wá', '娃')]
wo : [('未分类', '遤')]
xia : [('xiǎ', '閜')]
xiao : [('未分类', '﨧')]
xin : [('xǐn', '伈')]
xiong : [('未分类', '楿')]
xiu : [('xiú', '苬'), ('未分类', '鮴')]
xun : [('未分类', '嚑')]
yang : [('未分类', '礢')]
yo : [('未分类', '罀')]
you : [('未分类', '孧')]
yun : [('未分类', '抣')]
za : [('zǎ', '咋')]
zai : [('未分类', '岾')]
zang : [('未分类', '欌')]
zao : [('未分类', '栆')]
zen : [('zěn', '怎')]
zha : [('未分类', '蓙')]
zhan : [('zhán', '讝'), ('未分类', '蘸')]
zhao : [('zháo', '着'), ('未分类', '罀')]
zhe : [('未分类', '粍')]
zhei : [('zhèi', '这')]
zhen : [('未分类', '鋴')]
zhu : [('未分类', '墸')]
zhua : [('zhuǎ', '爪')]
zhuai : [('zhuāi', '拽'), ('zhuái', '转'), ('zhuǎi', '跩'), ('zhuài', '拽')]
zhuang: [('zhuǎng', '奘')]
zhui : [('zhuǐ', '沝')]
zhuo : [('未分类', '窧')]
zi : [('zí', '蓻')]
zuo : [('未分类', '咗')]
python代码
# -*- coding: utf-8 -*- import urllib.request import re indexHtml = urllib.request.urlopen('http://xh.5156edu.com/pinyi.html').read() urls = re.compile(r"<a class='fontbox' href="(.*?)">(.*?) ").findall(indexHtml.decode('gbk')) listsPattern = re.compile(r"<tr bgcolor=#ffffff ><td bgcolor='#FAFAFC' align=center ><p class=font_14[^>]*?>([^<]*?)</p>.{0,100}</td><td><a class='fontbox' href='[^']*?'>([^>]*?)<span>[^>]*?</span></a></td>s*?</tr>", re.I|re.M|re.S) for url in urls: print(url[1]) pageHtml = urllib.request.urlopen('http://xh.5156edu.com/' + url[0]).read() lists = listsPattern.findall(pageHtml.decode('gbk', 'ignore').replace(' </table><br>', '')) if len(lists) > 0: print(lists)
作者:知乎用户
链接:https://www.zhihu.com/question/20957209/answer/78025692
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
2 参考
[1] https://www.zhihu.com/question/20957209