• neo4j数据导入解决方案


    一、neo4j数据导入方法

    neo4j数据导入有两种方法,第一种是使用cypher语法中的LOAD CSV,第二种是使用neo4j自带的工具neo4j-admin import。

    LOAD CSV

    导入的文件必须是csv文件,位置可以是本地的,或通过http、https、ftp等url指定位置。

    neo4j中关于导入文件的设置是dbms.security.allow_csv_import_from_file_urls,默认为true;而导入本地文件的位置通过dbms.directories.import来指定导入的根目录,然后再使用file:///来表示绝对路径。

    示例一:不带header,用下标来索引

    给定artists.csv文件

    1,ABBA,1992
    2,Roxette,1986
    3,Europe,1979
    4,The Cardigans,1992

     输入语句:

    LOAD CSV FROM 'https://neo4j.com/docs/cypher-manual/3.5/csv/artists.csv' AS line
    CREATE (:Artist { name: line[1], year: toInteger(line[2])})

    示例二:带header,用关键字来索引

    给定artists-with-headers.csv文件

    Id,Name,Year
    1,ABBA,1992
    2,Roxette,1986
    3,Europe,1979
    4,The Cardigans,1992

    然后执行cypher语句:

    LOAD CSV WITH HEADERS FROM 'https://neo4j.com/docs/cypher-manual/3.5/csv/artists-with-headers.csv' AS line
    CREATE (:Artist { name: line.Name, year: toInteger(line.Year)})

    示例三:大csv文件分批导入

    USING PERIODIC COMMIT
    LOAD CSV FROM 'https://neo4j.com/docs/cypher-manual/3.5/csv/artists.csv' AS line
    CREATE (:Artist { name: line[1], year: toInteger(line[2])})

    这里默认1000行提交一次,也可以人为指定,比如using periodic commit 500.

    额外提示:如果值中包含引号,可以用""来表示".

    可以发现使用load csv只能导入结点,如果还想导入关系数据,就只能靠neo4j自带的import工具了。

    neo4j-admin import

    使用neo4j-admin import工具只能往空数据库中导入数据,且csv文件必须在import目录下。使用csv文件导入数据时,每个结点都必须有一个唯一的ID类属性,但是最好不要起名为ID,这会和数据库本身维护的ID字段冲突。

    二、neo4j导入实例

    1、本次的数据集为Movielens的数据集,下载地址:
    http://grouplens.org/datasets/movielens/

    2、在neo4j安装根路径下找到import之后在此文件夹下放入数据。

    3、在neo4j中导入数据并创建节点,因数据量过大,使用USING PERIODIC COMMIT 1000,防止数据过大溢出,with headers可以处理含有头文件的数据。

    USING PERIODIC COMMIT 1000
    load csv with headers from "file:///ratings.csv" as link
    with link       
    create(:Ratings{userId:link.userId,movieId:link.movieId,rating:link.rating,
    timestamp:link.timestamp
    })

     速度还是蛮快的!!!

    同上,导入users和movies数据

    4、创建节点之间的关系

    LOAD CSV WITH HEADERS FROM "file:///ratings.csv" AS row
    MATCH (m:Movies), (u:Users)
    WHERE u.userId = row.userId AND m.movieId = row.movieId
    CREATE (u)-[r:rating{value:row.rating}]->(m)

    5、如何快速删除Neo4j中数量级较大的数据(该方法是清楚数据库中所有的数据):

    1.关闭Neo4j服务器进程:
      命令:neo4j stop

    2.删除graph.db数据库文件:
      找到<NEO4J_HOME>/data/databases/路径,可以看到graph.db文件夹。删除此文件夹即可。

    3.重新启动Neo4j服务器:
      通过bin目录下执行如下命令启动Neo4j:/neo4j console

    导入csv数据时,如何将属性的String类型转换成int类型:

    //导入节点 电影类型  == 注意类型转换
    LOAD CSV WITH HEADERS  FROM "file:///genre.csv" AS line
    MERGE (p:Genre{gid:toInteger(line.gid),name:line.gname})

     

    参考文献:如何将大规模数据导入Neo4j

         neo4j 大量数据的批量导入

         neo4j的linux上安装

  • 相关阅读:
    linux线程
    linux线程
    c++之堆、栈、数据段、
    fork()、僵死进程和孤儿进程
    linux之管理mysql
    linux之管理apache
    Django 时间与时区设置问题
    Django rest framework:__str__ returned non-string (type NoneType) 真正原因
    Django获取当前页面的URL——小记
    Django中出现:TemplateDoesNotExist at
  • 原文地址:https://www.cnblogs.com/chen8023miss/p/11947110.html
Copyright © 2020-2023  润新知