• Python、R、Julia混合编程环境配置及相关工具安装


    1  Python环境配置

    1.1   安装Anaconda

    • Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。
    • Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。
    • 目前最流行的 Python 环境管理工具。
    • Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。

    Anaconda下载地址:https://www.anaconda.com/download/


    最好是64位的版本(除非你的电脑是32位的)。这里选择3.X或者2.X没关系,都可以,但建议选Python3版本。

    检查并配置环境变量

    Windows环境变量:

    请查看环境变量中是否有以下三个路径,若没有请自行添加:

    1. 默认路径本身;
    2. 默认路径+”Scripts”;
    3. 默认路径+”Libraryin”

    默认路径即为安装Anaconda时所设置的路径。例如:默认路径为:”C:UsersAdministratorAnaconda3”,那么需要添加的三个路径则是:

    • C:UsersAdministratorAnaconda3;
    • C:UsersAdministratorAnaconda3Scripts;
    • C:UsersAdministratorAnaconda3Libraryin
      第一个路径是Miniconda的根目录,也是最重要的路径!

    1.2   添加conda的国内国内镜像服务器

    因为conda下载文件要用到国外的服务器,速度一般会比较慢,我们可以通过增加一个清华的镜像服务器来解决。
    打开cmd终端或者Anaconda Prompt(快捷键: win+r :然后输入cmd,回车)。
    分别在cmd终端或者Anaconda Prompt里粘贴下面两行代码(每粘贴一行回车确认)。

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    conda config --set show_channel_urls yes
    

    1.3   创建Python虚拟环境

    在 cmd 终端输入: conda create –n 环境名称 python=版本号
    例如创建名称为course_py35,版本为python3.5的虚拟环境,cmd输入:conda create –n course_py35 python=3.5
    安装工具包的时候可能需要安装一些其他的工具,如果系统提示 proceed ([y]/n)? ,输入y, 回车就ok。
    出现如下图提示 “To activate this environment……”表示环境配置成功

    尝试触发刚创建的这个环境,输入: activate course_py35
    这里如果你用的是其他的名字,输入activate 名称就可以了
    如果命令行出现(course_py35)或者说是你自己设定的名称,表示已经载入这个环境

    你可以选择查看 Python 的版本是否是我们刚创建的3.5版本,输入:python
    不出意外的话,系统会给你反馈 python 的版本信息
    输入:quit()
    退出 python 环境(注意:此处的括号为英文状态下输入的)

    1.4   安装所需的 python 工具包

    可选择用conda或者pip安装包,为方便起见,先对conda和pip进行升级,cmd输入命令:

    conda update conda
    python -m pip  install --upgrade pip
    

    包安装命令:

    conda install package_name
    pip install package_name
    

    包升级命令:

    conda update package_name
    pip  install --upgrade package_name
    

    包移除命令:

    conda uninstall package_name
    pip uninstall package_name
    

    数据科学python常用包:

    numpy:为大型多维数组和矩阵添加Python支持,以及在这些数组上运行高级数学函数的大型添加包。
    scipy:用于科学计算的基础库。
    pandas:为Python中的数据结构、数据操作和分析编写的添加包。
    matplotlib:用于图形和数据可视化的全面2D绘图。
    seabron:基于matplotlib的Python可视化库。它提供了一个高级界面,用于绘制有吸引力的统计图形。
    scikit-learn:一个机器学习库。
    networkx:复杂网络分析库。
    statsmodels:用于构建统计模型。
    beautiful soup:用于网络爬虫。
    tweepy:用于Twitter抓取。
    bokeh :一个Python交互式可视化库,面向现代Web浏览器进行演示。它的目标不仅是以D3.js的风格提供优雅、简洁的新颖图形结构,而且还通过非常大或连续传播的数据集提供高性能交互功能。它有Python、Scala、Julia以及现在的R接口。

    2   R环境配置

    2.1   R下载与安装

    R官网地址:https://www.r-project.org/

    R下载地址:https://cran.r-project.org/mirrors.html

    为保证下载速度,可选择国内镜像地址

    检查环境变量

    环境路径:“默认路径inx64”
    CMD下输入R可进入R的控制台界面,如下图:

    2.2   R语言安装R package:

    (1)自动安装(在线安装)

    在R的控制台输入:install.packages("package_name")
    这种方法可能找不到需要的package,那么可以用 方法2

    (2)手动安装(离线安装)

    Windows:

    下载package.zip文件

    打开R的菜单栏->Packages->“Install package from local zip file…”

    选择package.zip文件

    查看全部安装的R包:.packages(all.available=T)
    查看某个安装的R包:
    library("XML")
    help(package="XML")
    
    R下常用包:

    ggplot:基于R的ggplot2和图形语法的Python绘图系统。它专为使用最少的代码快速制作具有专业外观的图而构建。

    对于R,查看添加包的最佳方法是查看CRAN任务视图,其中,添加包按使用类型聚合。

    https://cran.r-project.org/web/views/

    例如,有关高性能计算的CRAN任务视图,请访问:

    https://cran.r-project.org/web/views/HighPerformanceComputing.html

    3   Julia环境配置

    3.1 Julia下载与安装

    Julia下载地址:https://julialang.org/

    julia最新版本为julia-1.0.3,建议安装最新版本

    环境变量路径:"默认路径Julia-1.0.3in"

    启动:cmd输入julia,如下图:

    3.2 Julia配置

    (1)julia安装package

    julia安装package有两种方法:
    一种是通过Pkg.add()命令安装:在julia交互式环境输入以下命令:

    using Pkg
    Pkg.add("package_name")
    

    另一种方法是针对1.0以上版本,在julia交互式环境下输入']'切换至Pkg操作界面,如下图:
    通过add package_name命令安装。
    注意:由于julia服务器在国外,package安装时会由于网络不稳定出现失败,此时一个有效的解决办法是到本地存放package文件夹下找到安装失败的package手动删除后重新安装。window下默认的存放package的路径为:“C:Users用户名.juliapackages”。
    关于julia的第三方包的详细信息可以通过https://juliaobserver.com/ 查询。

    (2)julia配置

    Julia 的 REPL(交互式编程环境) 扩展性很强,比较有名的比如 OhMyREPL,它可以提供代码高亮,代码补全等功能。可在REPL中通过以下命令安装和使用:

    using Pkg
    Pkg.add("OhMyREPL") //安装包
    using OhMyREPL //调用包
    

    以上命令为Julia安装和使用package的通用方法,后面不在赘述。
    关于OhMyREPL的详细配置可以参考其官方文档:https://kristofferc.github.io/OhMyREPL.jl

    (3)julia调用Python、R混合编程

    Julia可以方便的调用Python和R,主要通过PyCallRCallConda三个包来实现,详细操作可查看其文档说明。
    注意:安装julia第三方包时,最好先查看其官方文档,确定适用版本后再安装使用。

    4   关于IDE

    目前,有很多IDE可同时搭建Python、R、Julia环境,如Vscode、Atom等,在此推荐Jupyter Lab,相比工程开发,其更适用于科学实验。

    Jupyter源于Ipython Notebook,是使用Python(也有R、Julia、Node等其他语言的内核)进行代码演示、数据分析、可视化、教学的很好的工具,对Python的愈加流行和在AI领域的领导地位有很大的推动作用。

    Jupyter Lab是Jupyter的一个拓展,提供了更好的用户体验,例如可以同时在一个浏览器页面打开编辑多个Notebook,Ipython console和terminal终端,并且支持预览和编辑更多种类的文件,如代码文件,Markdown文档,json,yml,csv,各种格式的图片,vega文件(一种使用json定义图表的语言)和geojson(用json表示地理对象),还可以使用Jupyter Lab连接Google Drive等云存储服务,极大得提升了生产力。
    安装Anaconda后,会包括jupyter notebook和Ipython内核,接下来需要完成三个步骤即可:

    (1)安装jupyter lab

    pip install jupyterlab
    

    (2)安装R kernel

    #在R中运行如下代码,来安装依赖的R包
    install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest'))
    devtools::install_github('IRkernel/IRkernel')
    #在R中运行如下代码,使得R在jupyter中可以被探测到。
    IRkernel::installspec(user = FALSE)
    

    报错,可以尝试:

    > devtools::install_github('IRkernel/IRkernel',force = TRUE)
    > install.packages("digest") 
    > devtools::install_github('IRkernel/IRkernel',force = TRUE)
    

    (3)安装Julia kernel

    #在julia REPL中运行以下代码
    using Pkg
    Pkg.add("IJulia")
    

    启动Jupyter Lab

    在cmd下输入:jupyter lab即可,界面如下图:

    注意:windows下启动可能会出现错误,此时可能需将系统防火墙关闭。

    以上即为本人在配置Julia、Python、R混合编程环境过程中的简单总结,如有问题,恳请指正。

  • 相关阅读:
    .NET Core 使用NPOI读取Excel返回泛型List集合
    C# 判别系统版本以及Win10的识别办法
    WPF 程序员休息数字时钟
    分享一个淘宝/天猫/京东/阿里 图片抓取工具
    记一次数据库同步经历(sql server 2008)
    datagridview 如何显示记载中
    关于如何解决bootstrap table 列 切换 刷新 高度不一样
    js 中 函数的返回值问题
    winform 实现定位
    winform 里 如何实现文件上传
  • 原文地址:https://www.cnblogs.com/luoh382/p/PythonRJulia-hun-he-bian-cheng-huan-jing-pei-zhi-j.html
Copyright © 2020-2023  润新知