• 我的nlp之路(1)


    1/8日任务

    基础篇:

    1. 如何使用远程连接从windows或者linux连到服务器进行操作(切换用户,传递文件) (严禁使用root账户)
    2. Linux基本bash命令

    a)        查看文件大小,内存大小,cpu信息,硬盘空间等等

    b)        查看目前运行程序情况,剩余内存,kill程序

    c)        运行一个程序

    d)       写一个脚本,使用上for, if等语句

    e)        sed命令, grep命令

    1. Awk练习

    a)        词、字的统计

    b)        取出某些特定的字段

    c)        改写:根据某个特定字段进行排序

    1. 程序运行实践

    a)        Stanford nlp: 分词、词性标注、句法分析; 整体跑一遍

    b)        HIT-ltp: 分词、词性标注、句法分析; 整体跑一遍

    c)        CMake使用

    d)       ZPar: 分词、词性标注、句法分析; 整体跑一遍(模型自己训练)

    e)        Berkeley parser使用 (模型自己训练)

    f)         情感分析代码跑一遍:NNContextSentiment

    g)        NNCRF跑一遍:NNSegmentation, NNPostagging, NNNameEntity

    h)        使用word2vec训练一个词向量

    1. 使用github,建立自己的github,建立自己的代码和文档仓库
    2. 查找一个你认为比较好用的开源应用软件(大众熟知的机器学习或者自然语言处理工具):例如我推荐 beyond compare, ConstTreeViewer, whatswrong
    3. 致力于研究的同学,使用latex(CTex工具包),使用yinxiang笔记
  • 相关阅读:
    mysql报错:java.sql.SQLException: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents more than one time zone.
    MD5登陆密码的生成
    15. 3Sum、16. 3Sum Closest和18. 4Sum
    11. Container With Most Water
    8. String to Integer (atoi)
    6. ZigZag Conversion
    5. Longest Palindromic Substring
    几种非线性激活函数介绍
    AI初探1
    AI初探
  • 原文地址:https://www.cnblogs.com/ldphoebe/p/5111669.html
Copyright © 2020-2023  润新知