• Neo4j 导入CSV工具导入


    第 1 步:下载 CSV 文件

    将以下文件下载到您的系统:

    解压这个文件。你应该有这些文件:

    • 人.csv

    • 电影.csv

    • 收视率.csv

    • 定向.csv

    • acted_in.csv

    第 2 步:打开数据导入器

    在 Web 浏览器窗口中,打开Neo4j 数据导入器

    你应该看到这个:

    Neo4j 数据导入器

    自本课程发布以来,Neo4j 数据导入器可能会发生变化。您将在 UI 中看到细微差别。

    如果您在 Graph Model 窗格中看到节点和关系,您应该选择所有这些并删除它们,以便您可以从新映射开始。

    第 3 步:将 CSV 文件加载到数据导入器中

    在左侧文件面板中,添加您在步骤 1中解压缩的五个 CSV 文件。

    添加它们后,您应该会看到:

    添加到数据导入器的文件

    加载它们后,请花几分钟时间查看用于每个文件的标题。

    第 4 步:定义人员节点映射

    1. 单击图形模型窗格中的添加节点图标。

    2. 在右侧的映射详细信息窗格中:

      1. 输入Person作为标签。

      2. 选择persons.csv文件。

      3. 在属性下,单击从文件添加

        1. 点击确认

      4. 请注意,某些属性名称与图形数据模型不匹配。修改它们如下:

        1. person_tmdbId -→ tmdbId

        2. person_imdbId -→ imdbId

        3. person_poster -→ 海报

        4. person_url -→ 网址

      5. 选择tmdbId作为将用于这些 Person 节点的唯一 ID。

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    映射的人员属性

    第 5 步:定义电影节点映射

    1. 单击图形模型窗格中的添加节点图标。

    2. 在右侧的映射详细信息窗格中:

      1. 输入电影作为标签。

      2. 选择movies.csv文件。

      3. 在属性下,单击从文件添加

        1. 点击确认

      4. 请注意,某些属性名称与图形数据模型不匹配。修改它们如下:

        1. movie_tmdbId -→ tmdbId

        2. movie_imdbId -→ imdbId

        3. movie_poster -→ 海报

        4. 电影网址 -→ 网址

      5. 另请注意,某些属性类型与我们的数据模型定义的不匹配。修改属性类型如下:

        1. 预算 -→ 整数

        2. imdbRating -→ 浮动

        3. imdbVotes -→ 整数

        4. 收入 -→ 整数

        5. 运行时 -→ 整数

        6. 年份 -→ 整数

      6. 选择movieId作为将用于这些电影节点的唯一 ID。请注意,我们选择了 movieID 作为唯一 ID,因为在我们定义与电影的关系时,它会在其他文件中使用。

    您无法使用数据导入器将所有字段转换为其目标属性类型。在本课程的下一个模块中,您将对图执行一些导入后重构。

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    映射的电影节点

    第 6 步:定义用户节点映射

    1. 单击图形模型窗格中的添加节点图标。

    2. 在右侧的映射详细信息窗格中:

      1. 输入用户作为标签。

      2. 选择rating.csv文件。

      3. 在属性下,单击从文件添加

        1. 仅选择userIdname属性。稍后将使用其他值来定义关系。

        2. 点击确认

      4. 选择userId作为将用于这些 Person 节点的唯一 ID。

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    映射的用户节点

    第 7 步:定义 DIRECTED 关系映射

    1. 在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

    2. 在右侧的映射详细信息窗格中:

      1. 输入DIRECTED作为类型。

      2. 选择directed.csv文件。

      3. 在 ID 部分:

        1. 选择 person_tmdbId 作为人员 ID。

        2. 选择movieId 作为电影ID。

    角色的directed.csv文件中没有字段,因此您不会从此文件中导入角色属性,因此您已完成。

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    映射的定向关系

    步骤 8:定义 ACTED_IN 关系映射

    1. 在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

    2. 在右侧的映射详细信息窗格中:

      1. 输入ACTED_IN作为类型。

      2. 选择acted_in.csv文件。

      3. 在 ID 部分:

        1. 选择 person_tmdbId 作为人员 ID。

        2. 选择movieId 作为电影ID。

      4. 在“属性”部分中,选择角色属性。

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    映射的 ACTED_IN 关系

    第 9 步:定义 RATED 关系映射

    请注意,此映射将重用您用于定义用户节点的同一文件。

    1. 在 Graph Model 窗格中,将User节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

    2. 在右侧的映射详细信息窗格中:

      1. 输入RATED作为类型。

      2. 选择rating.csv文件。

      3. 在 ID 部分:

        1. 选择 userId 作为用户 ID。

        2. 选择movieId 作为电影ID。

      4. 在“属性”部分中,选择等级 和时间戳属性。

      5. 请注意,某些属性类型与图形数据模型不匹配。修改它们如下:

        1. 评级 -→ 整数

        2. 时间戳 -→ 整数

    您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

    RATED 关系映射

    第 10 步:保存映射

    如果在导入过程中出现问题,我们建议您保存已映射的内容。

    1. 点击右上角的...。

    2. 选择下载模型名为neo4j_importer_model_yyyy-mm-dd.json的文件将下载到您的系统。

    保存模型

    第 11 步:导入 CSV 数据

    在导入数据之前,您必须拥有将要导入的 Neo4j 实例的相关信息。主机位置应该是为本课程创建的沙盒的螺栓 URL。您应该已收到包含此信息的电子邮件,但默认情况下,沙盒仅存在三天,并且在您继续课程时会重新创建沙盒。如果邮寄给您的凭据不起作用,或者您没有它们:

    1. 转到沙盒站点

    2. 登录以查看您的空白沙盒实例的详细信息:

    3. 您可以通过单击沙盒最右侧的下拉菜单来查看空白沙盒详细信息。您将在此处查看连接详细信息:

    空白沙盒凭据

    请按照以下步骤导入数据:

    1. 单击运行导入按钮。

    2. 主机字段中,输入空白沙箱实例中的 Websocket Bolt URL。

    3. 用户名字段中,输入neo4j

    4. 密码字段中,输入沙盒实例的密码。

    进口凭证
    1. 单击运行

    2. 它应该将数据导入您的空图表。(这将需要几分钟。)

    导入完成
  • 相关阅读:
    给西安市网民的一封信
    西客集推出西安我家的功能了
    西客集又增加新功能了
    为者常成,行者常至
    kvm虚拟机磁盘&文件系统扩容流程
    Git常用命令大全
    Linux下Nexus的部署教程
    sonatype nexus简介(转)
    curl时加参数o或重定向符号>>将结果输出不到文件里怎么办?
    吞吐量(TPS)、QPS、并发数、响应时间(RT)概念
  • 原文地址:https://www.cnblogs.com/smartisn/p/16327105.html
Copyright © 2020-2023  润新知