以前一直以为无法在pypy中安装gensim,尝试了一下其实还是可以的,不过性能不佳,可能有一些原因,需要进一步调查
麻烦的地方主要在于这是一个离线环境,没办法直接pip install ,目前是通过在一台可以联网的类似环境中先行执行,观察记录用到的py包以及linux 包,然后统统打包挎贝到目标主机上运行
这个过程真是比较麻烦,最好有相关的工具,不然真的很费时间
py包的安装基本上有两种, 一种是tar.gz 源码安装 , 一种是whl需要使用 pip install *.whl安装,还好这个不需要我一个一个的敲,只需要*.whl
系统包的安装需要注意,有时候依赖会很奇怪,一定要参考安装成功的那个环境上的包版本进行对应的安装, dpkg -l 列表, dpkg -P 卸载,dpkg -i 安装
为了解决缺少blas or xxx不存在的问题,需要安装一些相关的库,这里我使用了dpkg -i *.deb的方式,直接使用离线包,非常简单
安装时注意依赖包版本,装错了版本可能导致失败
gfortran-5_5.4.0-6ubuntu1~16.04.12_amd64.deb
libblas-common_3.6.0-2ubuntu2_amd64.deb
libblas-dev_3.6.0-2ubuntu2_amd64.deb
libgfortran-5-dev_5.4.0-6ubuntu1~16.04.12_amd64.deb
liblapack-dev_3.6.0-2ubuntu2_amd64.deb
gfortran_5.3.1-1ubuntu1_amd64.deb
libblas-common_3.7.0-2_amd64.deb
libblas3_3.6.0-2ubuntu2_amd64.deb
libgfortran3_5.4.0-6ubuntu1~16.04.12_amd64.deb
liblapack3_3.6.0-2ubuntu2_amd64.deb
安装多了以后,感觉还是离线包方便,除了某些包需要从源码python setup.py install,大部分情况下pip install *.whl, dpkg -i *.deb,这样最方便不过了