上一章节就是NLP的背景,内容比较骨感,其实写出来的每个小标题,都是树干,值得去深入学习,发展实战,这样也可以枝繁叶茂。
附注:如何打开ipynb后缀的文件,亲测有效。https://www.jianshu.com/p/89999a6b2028
一:安装环境。
1.安装Anaconda,说是Python的全家桶,但我不太明白和Python.exe的区别,感觉像个文件夹,或者多功能包。
https://www.anaconda.com/distribution/ 下载最新的版本。
安装步骤:https://blog.csdn.net/ITLearnHall/article/details/81708148
2.安装IDE,可以用ecilpse或者pycharm。(安装pycharm不做介绍了,实在是安装太多遍了)
3.需要将pycharm里的编译器什么的设置成Anaconda。
具体步骤参考以下链接:https://www.cnblogs.com/pejsidney/p/9216470.html
二:按照上面的步骤和链接,我成功安装了Anaconda和pycharm。
三字符串处理
1.strip()处理字符串左边和右边。rstrip()、lstrip()、strip(’特殊字符’)、find()、isalpha()、isdigit()这两个是判断某个字符串是不是全是字母或者全是数字。,这里测试的时候遇见一个问题哈,对字符串的操作都不起作用,还以为是少调用了某些包,导致函数没有加载进来。后来发现不是。
原因如下:
Python中的字符串为不可变类型,则你对msg本身做strip()都是无法更改的期原来的值,但是strip()会返回一个新的值,需要再次保存才可以体现!
2.字符串的分割和联合操作。
str.split( )切割完成后得到一个list
str.join()按照特定符号拼接字符串中的各个元组的内容。
如果正式使用的时候,想知道针对于某个对象的所有函数,用help(str)可以显示所有的操作函数。