• 第二步 在D2RQ平台上配置jena环境


    第二步 在D2RQ平台上配置jena环境
    2013年10月16日 9:48:53
    搞了这么长时间语义,只用过protege这样的工具,一直没有落实到实际代码上。jena也看过好久了,总认为是hp公司的东西算不上标准,现在看来,jena已经是语义应用开发中最主流的工具了,我就此选择jena进行语义应用的开发了。
     
     
    Getting started with Apache Jena

    Apache Jena (or Jena in short) 是免费开源的java框架用于构建语义网应用和关联数据应用。这个框架包括不同的处理RDF数据的API接口。如果你是菜鸟,你可以选择从下面的教程中开始,你也可以浏览感兴趣的主题文档。
     
    Tutorials
    竟然发现有大牛已经做过翻译了,好吧,我转载在这里,我郑重声明转载了“april 1019”这位大牛的工作,

    Jena文档《An Introduction to RDF and the Jena RDF API》的译文

    文档里包含的内容很多,还是回到具体的配置上来。

     
    Using the D2RQ Engine with Jena

     1. Jena Versions
        由于D2RQ内部嵌入了jena和SPARQL查询引擎,所以对jena和ARQ是敏感的。D2RQ只在相应的jena版本下工作。检索/lib/arq-X.Y目录下各包的版本,以下载合适的jena包。
        我下载的D2RQ是0.8.1,其/lib里面的jena的jar是2.7.0,所以从http://archive.apache.org/dist/jena/binaries/这里下载了apache-jena-2.7.0-incubating.tar.gz。还是解压到/opt文件夹下。
     
    2. 配置路径
        新建一个eclipse工程jena_test,然后右键-Build Path-Add Library-User Library,再把/opt/D2RServer/d2rq-0.8.1/lib下的d2rq-0.8.1.jar,添加入项目中。类似再添加commons-logging-1.1.jar和slf4j-api-1.6.4.jar到项目中,然后把/lib/db-drivers下的JDBC也加进来。
        D2RQ下载时会忽略一些Jena/ARQ jar,但这些jar也有可以会用到。可以把下载的放到这个lib中去。
     
    3. Logging
        D2RQ通过Apache Commons Logging的API记录日志信息。D2RQ搭载了Apache log4j(见注1),但你也可以使用不同的前端日志。
    为了获取D2RQ的调试信息,设置日志记录器的级别从de.fuberlin.wiwiss.d2rq改为ALL.简单的方法即是把/lib/logging的目录添加到构建路径中,新建一个文件log4j.properties,包括以下内容:
    log4j.rootLogger=INFO, stdout
    log4j.appender.stdout=org.apache.log4j.ConsoleAppender
    log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
    log4j.appender.stdout.layout.ConversionPattern=%d{HH:mm:ss} %-5p %-20c{1} :: %m%n
    log4j.logger.de.fuberlin.wiwiss.d2rq=ALL
    我在/lib/logging下新建了log4j.properties文件,复制了上面的内容,并把它也加到了项目中。
     
    4. 通过jena模型的API使用D2RQ
    ModelD2RQ类为D2RQ映射数据库中的数据提供了一个Jena的模型视图。
    下面的例子通过使用一个预先创建的映射文件介绍ModelD2RQ是如何创建的,也介绍了如何用Jena API从模型中提取论文及作者信息。
    // Set up the ModelD2RQ using a mapping file
    Model m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
     
    // Find anything with an rdf:type of iswc:InProceedings
    StmtIterator paperIt = m.listStatements(null, RDF.type, ISWC.InProceedings);
     
    // List found papers and print their titles
    while (paperIt.hasNext()) {
        Resource paper = paperIt.nextStatement().getSubject();
        System.out.println("Paper: " + paper.getProperty(DC.title).getString());
     
        // List authors of the paper and print their names
        StmtIterator authorIt = paper.listProperties(DC.creator);
        while (authorIt.hasNext()) {
            Resource author = authorIt.nextStatement().getResource();
            System.out.println("Author: " + author.getProperty(FOAF.name).getString());
        }
        System.out.println();
    }
    m.close();
    其中ISWC和FOAF类在Jena的schemagen工具中创建了, DC and RDF类也是Jena的一部分。
     
    5. 通过jena图的API使用D2RQ
        在一些情况中,最好用低水平的Jena图的API,而不是模型API,D2RQ提供图的接口的实现,即GraphD2RQ.
    下面的例子是介绍图API来查找2003年发表的所有论文。
    // Load mapping file
    Model mapModel = FileManager.get().loadModel("doc/example/mapping-iswc.ttl");
     
    // Parse mapping file
    MapParser parser = new MapParser(mapModel, "http://localhost:2020/");
    Mapping mapping = parser.parse();
     
    // Set up the GraphD2RQ
    GraphD2RQ g = new GraphD2RQ(mapping);
     
    // Create a find(spo) pattern
    Node subject = Node.ANY;
    Node predicate = DC.date.asNode();
    Node object = Node.createLiteral("2003", null, XSDDatatype.XSDgYear);
    Triple pattern = new Triple(subject, predicate, object);
     
    // Query the graph
    Iterator<Triple> it = g.find(pattern);
     
    // Output query results
    while (it.hasNext()) {
        Triple t = (Triple) it.next();
        System.out.println("Published in 2003: " + t.getSubject());
    };
    g.close();
     
    5.1 还有一个CachingGraphD2RQ
    除了CachingGraphD2RQ,还有一个CachingGraphD2RQ能够提供相同的API,使用LRU(最近最少使用算法)
    缓存记忆最近几个查询的结果。这会改进重复查询的效果,如果数据库在CachingGraphD2RQ类的使用期间发生改变的话,会报出数据的不一致性。
     
    6. Executing SPARQL queries against a ModelD2RQ
    D2RQ可以通过D2RQ模型响应SPARQL查询,下面的例子介绍D2RQ模型是如何创建的,以及SPARQL查询是如何执行的、结果是如何写入控制台的。
    ModelD2RQ m = new ModelD2RQ("file:doc/example/mapping-iswc.ttl");
    String sparql =
        "PREFIX dc: <http://purl.org/dc/elements/1.1/>" +
        "PREFIX foaf: <http://xmlns.com/foaf/0.1/>" +
        "SELECT ?paperTitle ?authorName WHERE {" +
        "    ?paper dc:title ?paperTitle . " +
        "    ?paper dc:creator ?author ." +
        "    ?author foaf:name ?authorName ." +
        "}";
    Query q = QueryFactory.create(sparql);
    ResultSet rs = QueryExecutionFactory.create(q, m).execSelect();
    while (rs.hasNext()) {
        QuerySolution row = rs.nextSolution();
        System.out.println("Title: " + row.getLiteral("paperTitle").getString());
        System.out.println("Author: " + row.getLiteral("authorName").getString());
    };
    m.close();
     
    7. The D2RQ Assembler
    D2RQ自带Jena编译器,Jena编译器的规格是RDF的配置文件,文件描述了如何构建一个Jena模型。更多的Jena编译器的信息,请看 Jena Assembler quickstart page.
    下面的例子介绍了D2RQ模型的编译规格
    @prefix : <#> .
    @prefix ja: <http://jena.hpl.hp.com/2005/11/Assembler#> .
    @prefix d2rq: <http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#> .
     
    <> ja:imports d2rq: .
     
    :myModel
        a d2rq:D2RQModel;
        d2rq:mappingFile <mapping-iswc.ttl>;
        d2rq:resourceBaseURI <http://localhost:2020/>;
        .
    D2RQ模型规格支持下面两种特性:
    d2rq:mappingFile:必要的,使用D2RQ的映射文件的URI来构建模型。
    d2rq:resourceBaseURI:设置基础URI来代替相对URI模型,转变为全URI。如果不特指的话,D2RQ会特选择一个适当的基础URI。
    下面的这种惯例用法,将从一个模型规范中创建一个D2RQ模型,并把它写入控制台。
    // Load assembler specification from file
    Model assemblerSpec = FileManager.get().loadModel("doc/example/assembler.ttl");
     
    // Get the model resource
    Resource modelSpec = assemblerSpec.createResource(assemblerSpec.expandPrefix(":myModel"));
     
    // Assemble a model
    Model m = Assembler.general.openModel(modelSpec);
     
    // Write it to System.out
    m.write(System.out);
     
    m.close();
     
    8. Javadoc API documentation
        Javadoc API documentation for the latest releaseis available.
     
     
    注1:Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式;通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过程。最令人感兴趣的就是,这些可以通过一个配置文件来灵活地进行配置,而不需要修改应用的代码。
     
     
    第二步就写到这里,供大家参考。有需要交流的可以加QQ: 1q7q1q5q3q6q0q1q8(去掉中间的q)。
     
     
     





  • 相关阅读:
    Scrum Meeting 6 -2014.11.12
    Scrum Meeting 5 -2014.11.11
    Bing词典vs有道词典比对测试报告——体验篇之成长性及用户控制权
    团队项目的用户需求及反馈
    Scrum Meeting 4 -2014.11.8
    Scrum Meeting 3 -2014.11.5
    bing词典vs有道词典对比测试报告——功能篇之细节与用户体验
    Bing词典vs有道词典比对测试报告——功能篇之辅助功能,差异化功能及软件的效能
    Bing词典vs有道词典比对测试报告
    hdu 5087 次长升序串的长度
  • 原文地址:https://www.cnblogs.com/aniuer/p/3373314.html
Copyright © 2020-2023  润新知