• 【python】使用jieba分词并导出txt


     主要步骤:

    1.读取文件

    2.jieba分词

    3.写入文件

    完整代码如下:

    import jieba
    fR = open('gp.txt', 'r', encoding='UTF-8') //读取文件
    sent = fR.read()
    sent_list = jieba.cut(sent) //使用jieba进行分词
    fW = open('gp2.txt', 'w', encoding='UTF-8') //写入文件
    fW.write(' '.join(sent_list))
    fR.close()
    fW.close()

    分词后结果:

    华龙 证券 新华路 营业部 总经理 邓丹 在 接受 记者 采访 时 指出 : “ 周二 尾市 收于 2900 点 之上 , 使得 短期 虽然 积累 了 下跌 的 压力 , 但是 仍然 不大可能 深幅 调整 , 更 多 地 是 盘中 洗盘 后 继续 向上 。 就 后市 来讲 , ‘ 领先 指标 ’ 上证 50 收复 了 年线 大关 , 最高 距离 回 补缺 口 只有 17 个点 , 若能 补缺 , 对 上证指数 也 有 正面 的 影响 。 而 单独 就 上证指数 来讲 , 后面 需要 关注 的 压力 位 , 一个 是 运行 到 2924 点 的 500 天线 , 其次 是 前期 提到 的 2934 点 , 然后 是 2955 点 缺口 上 沿 , 最终 要 注意 120 周线 在 2970 点 附近 的 重压 区 。 总之 , 连续 收阳尚 不能 等同于 牛市 , 不过 上证指数 短期 形势 依然 不差 , 只是 震荡 会 逐渐 加剧 , 涨速 将 慢慢 放缓 。 投资者 在 操作 上 , 关注 底部 躁动 的 资源 类 蓝筹股 和 重启 升势 且 完成 回 踩 的 二线 消费 股 。 ” 

  • 相关阅读:
    unix操作系统一些笔记
    安装SQL SERVER2008 R2出现的几个问题
    js中的类型和函数参数传递类型问题
    js一些要点
    百度2015年前端笔试题(南京区域)
    js 函数中的 this 问题
    html细节
    前后台读取Web.config中的值的方法
    使用的 SQL Server 版本不支持数据类型“datetime2”.
    物料主数据MRP4中的独立/集中
  • 原文地址:https://www.cnblogs.com/helenlee01/p/12617492.html
Copyright © 2020-2023  润新知