从昨天起就开始在实验室的暑期学习啦,昨天在机房学会用U盘装ubuntu server。
今天老师布置了用Python写文本处理的脚本的任务,包括处理PDF/DOC/TXT/EXCEL等等。
先处理PDF,上网查了一下,pypdf已经停更了,它的功能比较少,现在使用的是pypdf2。
但是pypdf2我安装不成功,后来发现它似乎是适合linux环境下的,于是根据命令行的错误提示把setup.py里的包含路径语句改了改,但是还是有一点问题,提示package directory does not exist,后来在一篇博客里找到一个差不多的问题:
BeautifulSoup的安装,我是在Windows下安装的,官网上没有window下安装的教程,我是凭感觉装上的。它有一个setup.py,我就用"python.exe setup.py install"运行了,但提示"error: package directory 'bs4' does not exist",原来是默认python执行路径不在当前目录,而是在C盘下面的用户目录中,所以把bs4文件移动过去就好了。跑完好,生成一个build文件夹,我知道它肯定要放到Python文件下的LIB文件夹里面去,所以就把下面的bs4移到LIB中去,就可以了。以后要用,直接import即可。如果是linux用户装起来应该会更顺利些。
所以我把PyPDF2这个文件夹放到了python.exe所在的目录下,然后把PyPDF2放到Lib目录下去,这样就OK了,PyPDF2安装成功。