• 离线下载安装NLTK的nltk_data数据包(转载+夹带私货)


    转载自:https://blog.csdn.net/qq_43140627/article/details/103895811
    本来NLTK可以通过简单的nltk.download()下载所需要的文件,但是,这会出现网络问题,非常慢,甚至直接连不上。所以我们需要离线下载nltk_data。

    一、下载数据文件

    官方数据在https://github.com/nltk/nltk_data/tree/gh-pages中,不过,在github上下载文件也挺慢的。所以,这里我们可以去码云上找到对应的项目https://gitee.com/qwererer2/nltk_data/tree/gh-pages/(链接如果失效可以在码云自行搜索nltk_data)。 下载得到nltk_data-gh-pages.zip文件。

    重点: 别忘了你是把整包都下下来了(我们需要的是其中的package),要把解压出来的文件夹package挪到对应的nltk搜索目录下。并且将packages文件夹重新命名为nltk_data。(我在这里被坑了)

    二、将nltk_data文件夹移到对应的目录

    nltk的搜索路径为:

    import nltk
    nltk.find('.')


    Searched in:

    • 'C:Users15839/nltk_data'
    • 'E:python_env lp ltk_data'
    • 'E:python_env lpshare ltk_data'
    • 'E:python_env lplib ltk_data'
    • 'C:Users15839AppDataRoaming ltk_data'
    • 'C: ltk_data'
    • 'D: ltk_data'
    • 'E: ltk_data'

    将nltk_data文件夹移到上述任意文件路径即可。

    下面是我移动之后的文件路径:

    三、测试

    from nltk.book import *

    出现这样的信息表示安装成功了,哈哈。

    参考:离线下载安装 NLTK 的 nltk_data 模块

    注:分享数据集的下载链接:
    链接: https://pan.baidu.com/s/1hVRNHg4gx4cDSsQ4vD1_yA 提取码: 2333
    码云下载的速度非常慢,为了加速可以参考加速器,可以达到1M/s的下载速度

  • 相关阅读:
    SpringIOC的小例子
    java中递归实现复制多级文件夹
    快速排序和几种简单排序
    Oracle面试的基本题
    多态的两个小例子
    单例模式
    内部类与匿名内部类
    C#
    C#
    C#
  • 原文地址:https://www.cnblogs.com/mengxiaoleng/p/14016938.html
Copyright © 2020-2023  润新知