#只关心word文档中的文本,不关心样式信息,就可以利用getText()函数
import docx
def getText(filename):
doc=docx.Document(filename)
fullText=[]
for para in doc.paragraphs:
fullText.append(para.text)
return '
'.join(fullText)
print(getText('example.docx'))
#下面的代码可以实现同样的功能
doc2=docx.Document('example.docx')
#paragraphs是paragraph对象的列表 所以下面这个会显示数字
for i in range(0,len(doc2.paragraphs)):#获取段落的数量
print(doc2.paragraphs[i].text)#text显示段落的文本