主要分两块:使用Python爬取数据,使用R语言分析。
1、https://www.python.org/ ,下载最新版Python2.7.10,安装过程中勾选“Add Python.exe to Path”,默认是不安装的。
2、安装完成后,打开cmd,输入“python”,若提示“Python不是内部或外部命令”,就将Python安装路径添加到Path。
3、下载BeautifulSoup:https://pypi.python.org/pypi/beautifulsoup4/ ,解压,cmd进入解压目录,执行python setup.py install。
4、测试下urllib:打开IDLE,输入import urllib,print urllib.urlopen('http://www.baidu.com').read()。