• R(三): R包原理及安装


      包(package)是多个函数的集合,常作为分享代码的基本单元,代码封装成包可以方便其他用户使用。越来越多的R包正在由世界上不同的人所创建并分发,这些分发的R包,可以从CRAN 或 github 上获取,由于向 CRAN 提交包审核非常严格,有些开发者并没有将自己开发的R包提至CRAN的意向,通过 devtools 可以轻松从 github上下载安装。包的生命周期一般会经历 source、bundled、binary、installed和in-memory五个阶段。参考资料 (http://r-pkgs.had.co.nz/intro.html) 

    目录:

    • R包基本内容
    • R的不同形式
    • R包相关命令

    R包基本内容:


    • 包中包含的内容按重要程序递减顺序包含以下几个部分,(红色表示一个包中必须包含的元素)

      1. R代码(R/):位于R/文件夹,放置R代码文件,只有这一个目录的文件夹也是有用的包
      2. 包的元信息(DESCRIPTION):包描述文件,文件中一般还包含该包的功能说明、使用权限等
      3. 文档(man/):介绍如何使用该包
      4. Vignettes(Vignettes/):描述包中每个函数细节的文档,展示了包中各部分配合使用解决具体问题
      5. 测试集(tests/):确保包按设计工作,testthat包可将已完成的交互式测试转换为正式的自动化测试
      6. 命名空间(Namespace):定义该包的哪些函数可供其它包使用,以及需要哪些包的其它函数
      7. 外部数据(data/):data/目录为包提供数据,可以供R用户方便的使用,或者为文档提供令人信服的例子
      8. 其它部分:demo/、exec/、po/和tools/等

    不同形式的R包: (参考 http://r-pkgs.had.co.nz/package.html


    • source包 :  开发时的源代码包,包含R/、DESCRIPTION等
    • bundled包:将source包reduced成一个单个文件(.tar), 使用gzip(.gz)压缩成一个.tar.gz文件的包(在linux常看到的包名后缀),它和source包的区别在于:
      1. Vignettes被编译成了HTML和PDF文件
      2. 没有了source包中的临时文件 (source包中.Rbuildignore文件中标明的文件被排除在bundled包外)
    • binary包:binary包可供没有编译环境的R用户使用,它也是单个文件,但是解压开和source包差别很大 (注意:binary包和平台相关,Mac的包.tgz和Windows的.zip不能通用)
      1. R/文件夹中并没有R文件,而是3个解析后可供高效调用的文件,这是加载R代码用save()函数保存的结果
      2. Meta/文件夹包含一些rd文件,这些是包相关的元数据缓存,可以用readRDS()查看文件内容,这些文件加速了包的加载
      3. html/文件夹包含了HTML帮助需要的文件
      4. src/目录变成libs/目录,包含了将源代码编译成的库
      5. inst/的内容被移到了顶层目录
    • installed包:installed包是将binary包解压(安装)到特定的库目录,如下图展示了包的不同安装方法
    • memory包:使用包之前,必须先加载到内存, 可使用library() 和 require() , 其中调用 library()函数时,如果包不存在,程序会中止并报错。调用requrie() 函数,当包不存在时,调给出警告,程序继续向后执行。
    • 当包加载到内存后,使用包时不需要用包名,比如:用install() 而不用 devtools::install(),如图
    • 小结:
      1. 从网上下载的R的包(package)通常有两种:binary package 和 Source package
      2. binary package:这种包属于即得即用型(ready-to-use),但是依赖与平台,即Win和Linux平台下不同
      3. Source package: 此类包可以跨平台使用,但用之前需要处理或者编译(compiled)
      4. 不同平台对应的不同的后缀名,分别为:
    • linux环境编译运行:tar.gz文件
    • windows 环境编译运行 :.zip文件
    • MacOSg环境编译运行:.tgz文件

    包相关命令:


    • install.packages():   连网时,在线安装发布在CRAN上的包。 如:install.packages("ape")
    • install.packages(your.zip.files, repos=NULL): 安装下载到本地的R包
    • .libPaths(): 查看包的安装目录
    • installed.packages():查看已安装包信息
    • .packages(all.available = TRUE):查看已安装包信息
    • library(mypackage):载入mypackage包
    • getOption("defaultPackages"):查看启动R时自动载入的包
    • search():查看当前载入的包
    • sessionInfo():查看R中载入的包
    • Sys.getenv("R_HOME"):查询R HOME安装地址
    • Sys.getenv("HOME"):查询用户HOME地址
    • remove.packages("mypackage"):卸载package
    • detach("package:demo"): 删除当前session内存中已加载的包
    • update.packages( ):更新包

    github程序包安装:


    • 依赖 devtools 工具, 安装命令: install.packages("devtools")
    • devtools包的install_github()函数用于从Github下载并在本地安装R包,安装示例代码如下:
      library(devtools)
      install_github('badbye/baidumap')
    •  示例中发现:install.packages()和install_github()函数所需的参数是不同的。install.packages()只需包名即可,而install_github()需要提供Github的仓库名。这意味着当你想从Github上安装一个R包的时候你必须准确的记得它的仓库名称, 麻烦的是,我们往往很难记住Github的用户名

    • githubinstall包提供了一种类似于install.packages()的方式,只需包名即可从github上安装R包,已发布至CRAN,安装命令如下:
      install.packages("githubinstall")
    • 当再安装github上的包时,示例代码如下:

      library(githubinstall)
      githubinstall("baidumap")
  • 相关阅读:
    Linux:运维基础网络知识(下)
    Linux:运维基础网络知识(上)
    Linux :linux系统磁盘(fdisk、partprobe、mkfs、mount、df、sort、swap、inode、block)
    Linux:操作系统用户权限(useradd、usermod、userdel、groupadd、groupmod、chown、id、uid、sudo)
    Linux:三剑客之 awk
    Linux:三剑客之 sed
    Linux :和时间相关的命令(date,ntpdate)
    Linux:文件属性信息-软硬链接数(ln)
    Linux:文件属性信息-(inode、block)
    Linux:系统中如何对文件进行压缩处理(tar)
  • 原文地址:https://www.cnblogs.com/zhp2016/p/5998336.html
Copyright © 2020-2023  润新知