GolVe 训练 语料库
-
将语料库进行分词
英文天然的已经以空格分好词。 只需要再对 don't 等词处理成 do n't即可
-
获取GolVe代码
git clone https://github.com/stanfordnlp/GloVe.git
-
将分好词的语料库移动到GolVe文件夹下
mv sentence2.csv GloVe/
-
cd GloVe/
-
将demo.sh中make之后CORPUS之前的代码注释。然后将CORPUS的值替换成自己的语料库文件名
-
make && bash demo.sh