• MySQL 导入导出 CSV 文件


    导入

    参考:LOAD DATA INFILE 语法的官方手册

    示例:

    LOAD DATA INFILE 'data.txt' INTO TABLE db2.my_table;
    LOAD DATA INFILE 'data.txt' INTO TABLE db2.my_table FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' LINES TERMINATED BY '
    ';

    常用参数:

    • FIELDS TERMINATED BY ',':指定字段分隔符
    • OPTIONALLY ENCLOSED BY '"':认为双引号中的是一个独立的字段。Excel 转 CSV 时,有特殊字符(逗号、顿号等)的字段,会自动用双引号引起来
    • LINES TERMINATED BY ' ':指定行分隔符,注意,在 Windows 平台上创建的文件,分隔符是 ' '

    导出

    参考:SELECT … INTO 语法的官方手册

    SELECT … INTO 语法可以将查询结果保存到变量或文件中:

    SELECT ... INTO var_list    # 将字段的值保存到变量中
    SELECT ... INTO OUTFILE     # 将选中的行保存到文件中。可以指定列和行的结束符,以生成指定格式的文件。
    SELECT ... INTO DUMPFILE    # 将一个单独的行写入文件中,没有格式

    示例:

    mysql > SELECT a,b,a+b INTO OUTFILE '/tmp/result.txt'
      FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
      LINES TERMINATED BY '
    '
      FROM test_table;
    
    mysql> SELECT * INTO OUTFILE '/var/lib/mysql-files/1.txt' 
        FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
      LINES TERMINATED BY '
    '
      FROM professions;
    Query OK, 2220 rows affected (0.04 sec)

    常用参数(跟 LOAD DATA INFILE 语法一样):

    • FIELDS TERMINATED BY ',':指定字段分隔符
    • OPTIONALLY ENCLOSED BY '"':认为双引号中的是一个独立的字段。Excel 转 CSV 时,有特殊字符(逗号、顿号等)的字段,会自动用双引号引起来
    • LINES TERMINATED BY ' ':指定行分隔符,注意,在 Windows 平台上创建的文件,分隔符是 ' '

    清空表中的所有数据

    操作失误时,需要简单的方式清空表,有两种方式:不带 where 参数的 delete 语句,或 truncate。

    delete from my_table;
    truncate table my_table;

    truncate 相当于使用表的结构重新创建表,所有的状态都相当于新表。
    不带 where 参数的 delete 则是将表中所有记录一条一条删除。

    truncate 比 delete 快,但 truncate 删除后不记录日志,数据无法恢复。

    注意事项

    Windows 中用 Excel 导出的 CSV 文件,采用 UTF-8-BOM 编码,换行符是 CRLF 回车换行。但是在 Linux 中不支持 UTF-8-BOM 编码,需要手动转为 UTF-8 编码。如果换行符用 CRLF 回车换行,则需要在 LOAD DATA INFILE 命令中通过 LINES TERMINATED BY ' ' 明确指定换行符:

    LOAD DATA INFILE 'data.txt' INTO TABLE db2.my_table FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' LINES TERMINATED BY '
    ';

    如果已经转为 LF 换行了,则可以省略这一句。

    这里写图片描述

    常见问题

    ERROR 1290 (HY000): The MySQL server is running with the --secure-file-priv option so it cannot execute this statement

    这一般是因为,你上传或下载的文件没有在 MySQL 指定的安全目录中。默认情况下,MySQL 导入导出文件时,只能使用安全目录。使用下面的命令查看 MySQL 的安全目录:

    mysql> SHOW VARIABLES LIKE "secure_file_priv";
    +--------------------------+-----------------------+
    | Variable_name            | Value                 |
    +--------------------------+-----------------------+
    | require_secure_transport | OFF                   |
    | secure_auth              | ON                    |
    | secure_file_priv         | /var/lib/mysql-files/ |
    +--------------------------+-----------------------+
    3 rows in set (0.00 sec)

    解决方案有两个:

    1. 将文件复制到 secure_file_priv 指定的安全目录。推荐。
    2. /etc/my.cnf 配置文件(Windows 平台下是 my.ini)中关闭 secure_file_priv。这个选项无法动态配置,修改后必须重启。

    对于第一个方案,复制文件到安全目录后,需要使用完整路径:

    mysql> load data infile '/var/lib/mysql-files/profession.csv' into table professionss fields terminated by ',' lines terminated by '
    ';

    数据中的第一个字段始终报错

    如果是整数,则报错如下:

    ERROR 1366 (HY000): Incorrect integer value: '1800' for column 'CompanyID' at row 1

    Windows 平台下创建的文件基本上都使用了 BOM 头,即在文件的头部添加描述性信息,可以参考 这里。这会在 Linux 平台下导致致命错误,去掉这个 BOM 头就好了。

    Excel 另存为 CSV 文件后,默认编码是“使用 UTF-8 BOM 编码”,在 Notepad++ 中打开文件,选择“使用 UTF-8 编码”保存即可清除 BOM 头:
    Notepad++

    部分数据保存失败,且有异常数据

    数据中出现了双引号,且部分数据插入失败,并插入了部分异常数据:
    error
    Excel 另存为 CSV 文件后,对于特殊字符(逗号、顿号等)的字段,会自动用双引号引起来。但是添加的双引号的位置竟然会出错:

    1800,1,3,2021304,202,"计算机系统分析技术人员
    ",1
    1800,1,3,2021305,202,"维护工程师
    ",2
    1800,1,3,2021306,202,"销售工程师
    ",1

    可以看到,好多行发生了不应该的换行。两个解决方案:

    • 使用 OPTIONALLY ENCLOSED BY '"' 自动处理,推荐:
    mysql> LOAD DATA INFILE '/var/lib/mysql-files/profession.csv' INTO TABLE professionss FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' LINES TERMINATED BY '
    ';
    Query OK, 2220 rows affected (0.06 sec)
    Records: 2220  Deleted: 0  Skipped: 0  Warnings: 0
    • 通过正则批量替换将 ", 替换为 , 使表格数据没有问题:
    mysql> LOAD DATA INFILE '/var/lib/mysql-files/profession.csv' INTO TABLE professionss FIELDS TERMINATED BY ',' LINES TERMINATED BY '
    ';
    Query OK, 2220 rows affected (0.06 sec)
    Records: 2220  Deleted: 0  Skipped: 0  Warnings: 0
  • 相关阅读:
    共享
    mac下搭建基于vue-cli 3.0的Element UI 项目
    rsync | scp文件同步命令使用
    在centos 6.9下Protocol Buffers数据传输及存储协议的使用(python)
    mysql中group by存在局限性探讨(待续)
    Protocol Buffers数据传输及存储协议简单使用
    简单数据库分表的思路
    mysql索引优化
    黑苹果相关资源
    JS 如何获取当前上一个月、下一个月和月份所含天数
  • 原文地址:https://www.cnblogs.com/kika/p/10851594.html
Copyright © 2020-2023  润新知