• 【python】使用jieba分词并导出txt


     主要步骤:

    1.读取文件

    2.jieba分词

    3.写入文件

    完整代码如下:

    import jieba
    fR = open('gp.txt', 'r', encoding='UTF-8') //读取文件
    sent = fR.read()
    sent_list = jieba.cut(sent) //使用jieba进行分词
    fW = open('gp2.txt', 'w', encoding='UTF-8') //写入文件
    fW.write(' '.join(sent_list))
    fR.close()
    fW.close()

    分词后结果:

    华龙 证券 新华路 营业部 总经理 邓丹 在 接受 记者 采访 时 指出 : “ 周二 尾市 收于 2900 点 之上 , 使得 短期 虽然 积累 了 下跌 的 压力 , 但是 仍然 不大可能 深幅 调整 , 更 多 地 是 盘中 洗盘 后 继续 向上 。 就 后市 来讲 , ‘ 领先 指标 ’ 上证 50 收复 了 年线 大关 , 最高 距离 回 补缺 口 只有 17 个点 , 若能 补缺 , 对 上证指数 也 有 正面 的 影响 。 而 单独 就 上证指数 来讲 , 后面 需要 关注 的 压力 位 , 一个 是 运行 到 2924 点 的 500 天线 , 其次 是 前期 提到 的 2934 点 , 然后 是 2955 点 缺口 上 沿 , 最终 要 注意 120 周线 在 2970 点 附近 的 重压 区 。 总之 , 连续 收阳尚 不能 等同于 牛市 , 不过 上证指数 短期 形势 依然 不差 , 只是 震荡 会 逐渐 加剧 , 涨速 将 慢慢 放缓 。 投资者 在 操作 上 , 关注 底部 躁动 的 资源 类 蓝筹股 和 重启 升势 且 完成 回 踩 的 二线 消费 股 。 ” 

  • 相关阅读:
    [翻译] Blocks and Variables
    UIView独占响应事件
    iOS中block类型大全
    Erlang入门(二)—并发编程
    Erlang入门(一)
    学习Erlang--1、入门
    一位Erlang程序员的自白
    安装ejabberd2并配置MySQL为其数据库
    JDBC 与ODBC的区别
    ejabberd的多域名(domain)设置
  • 原文地址:https://www.cnblogs.com/helenlee01/p/12617492.html
Copyright © 2020-2023  润新知