• Java调用R语言


    R是统计计算的强大工具,JAVA是做应用系统的主流语言。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。

    一、Rserve(远程通信模式)

      Rserve是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。
      Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器就可以供客户端调用。首先建立一个新的连接,然后就可以使用eval之类的方法将R中的表达式传到服务器端,通过R求值后传回JAVA中REXP类型的变量,然后打印出来,整个过程非常简单。由于不需要对R进行初始化,因此速度会比较快。在其他系统下可以同时建立多个连接,但是在Windows下只允许同时打开一个连接,后续的连接都会共有相同的命名空间。
      

    1、Rserve安装和启动(windows环境)
      方法一:前提:安装并配置了R语言
        第一次启动安装Rserve包:
        install.packages("Rserve")
    
        第一次启动加载Rserve包:
        library(Rserve)
    
        启动Rserve服务:
        Rserve()
    
        关闭Rconnection连接:
        关闭Rconnection连接用rc.close();
    

     

    方法二:点击R工具栏上的“程序包”--》“设定CRAN镜像”--》China(xxx) —》确定
        点击【程序包】—》安装程序包—》选择 rJava —>OK	
        点击【程序包】—》安装程序包—》选择 Rserve —>OK
    
        点击【程序包】—》加载程序包—》选择 rJava —>OK	
        点击【程序包】—》加载程序包—》选择 Rserve —>OK
    
        安装命令:install.packages("packageName")
        加载命令:library(packageName)
    
        启动命令:Rserve()
    

    2.Java调用R

        

    基本方法:
        Rconnection:连接R服务
        eval():执行R语句
        assgin():声明变量
        REXP:
        asInteger(), asIntegers(), asString(), asDouble(), asDoubles(), asList()获取相应类型的数据
    

    引用R架包或者添加maven配置:

    <!--REngine Java Interface to R -->
    <dependency>
        <groupId>org.rosuda.REngine</groupId>
        <artifactId>REngine</artifactId>
        <version>2.1.0</version>
    </dependency>
    <dependency>
        <groupId>org.rosuda.REngine</groupId>
        <artifactId>Rserve</artifactId>
        <version>1.8.1</version>
    </dependency>
    

    实例1:求一个数组里面的最大值

    //建立连接
    RConnection rc=new RConnection();
    //构建数据
    int[] datas={314,451,56,24,631};
    //声明变量,相当于在R命令行中输入data<-datas命令
    rc.assign("data",datas);
    //执行R语句,相当于在R命令行中输max(data)命令
    REXP rexp=rc.eval("max(data)");
    //REXP. asXxx()返回相应类型的数据,如果结果类型不符会出错
    System.out.println(rexp.asInteger());
    rc.close();
    

    实例2:调用自定义函数

         

    创建R文件test.R 
            myFunc<-function(data){
              x<-data+2;
            }
    
    复制代码
    RConnection rc = new RConnection();
    // test.R的路径
    String fileName = "D:\test.R";
    rc.assign("fileName", fileName);
    //执行test.R脚本,执行这一步才能调用里面的自定义函数myFunc,如果不行,就在R工具上也执行一下test.R脚本
    rc.eval("source(fileName)");
    String num = "3";
    //调用myFunc函数
    REXP rexp=rc.eval("myFunc("+num+")");
    //返回类型是一个整数类型,所以用asInteger
    System.out.println(rexp.asInteger());
    rc.close();
    

        在R-x.x.xlibraryRserveclientjavaRserve est目录下有测试用例可以参考。(StartRserve.java是用java启动Rserve服务,而不用打开R语言来手动启动。test.java里包含了基本方法的调试)

    二、JRI(嵌入式模式)

          JRI,全名是Java/R Interface,是通过调用R的动态链接库从而利用R中的函数等。通过install.packages("rJava")安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,里面有自带的例子可以用来测试。
          

    配置环境变量:在PATH中添加%R_HOME%/bin和%R_HOME%/library/rJava/jri,注意R_HOME的路径要正确。
    安装rJava
    install.packages("rJava")
    设置环境变量:	PATH后添加%R_HOME%library
    Javajri
    获取jar包:把安装目录jri文件夹下的JRI.jar、REngine.jar和JRIEngine.jar放进Java工程添加到工程中。
    

    两种方式优缺点比较:
        

    JRI(嵌入式模式)我体会到最大的优点是它对中文的支持较好,但是使用JRI模式下很容易造成整个系统的崩溃,比如在java调用R的时候,中间出现了异常或者错误,这些错误大致都是致命的,导致java虚拟机崩溃,从而导致整个系统崩溃
    Rserve(远程通信模式) 在这种通信模式下,最大的优点是javaWeb项目不需要去维护R的运行,通过TCP/IP协议直接进行通讯,但是有一个很大的缺点是它对中文的支持很弱,尤其是在windows的环境中。基本是不支持中文的,在linux环境下,似乎对中文的支持稍微好些。不是完全支持中文的话,对返回有中文或者输入有中文的系统将是不可用的。

  • 相关阅读:
    【linux】统计文件夹中文件行数
    【python】__import__
    【深度学习】吴恩达网易公开课练习(class2 week1 task2 task3)
    【python】多进程共享变量Manager
    【python】随机数用法
    【深度学习】吴恩达网易公开课练习(class2 week1)
    DIY博客园的博客皮肤
    电子图书馆(仿百度文库)
    查看html元素绑定的事件与方法的利器
    HyPer: A Hybrid OLTP&OLAP Main Memory Database System Based on Virtual Memory Snapshots
  • 原文地址:https://www.cnblogs.com/eternityz/p/12269836.html
Copyright © 2020-2023  润新知