• mysql 的大文本存储TEXT & BLOB


    TEXT & BLOB

    一般在保存少量字符串的时候,我们会选择 CHAR 或者 VARCHAR;而在保存较大文本时,
    通常会选择使用 TEXT 或者 BLOB,二者之间的主要差别是 BLOB 能用来保存二进制数据,比
    如照片;而 TEXT 只能保存字符数据,比如一篇文章或者日记。TEXT 和 BLOB 中有分别包括
    TEXT、MEDIUMTEXT、LONGTEXT 和 BLOB、MEDIUMBLOB、LONGBLOB3 种不同的类型,它们
    之间的主要区别是存储文本长度不同和存储字节不同,用户应该根据实际情况选择能够满足
    需求的最小存储类型。

    BLOB 和 TEXT 值会引起一些性能问题,特别是在执行了大量的删除操作时.
    可以使用合成的(Synthetic)索引来提高大文本字段(BLOB 或 TEXT)的查询性能;

    如果散列算法生成的字符串带有尾部空格,就不要把它们存储在 CHAR 或 VARCHAR 列中,它们会受到尾部空格去除的影响。合
    成的散列索引对于那些 BLOB 或 TEXT 数据列特别有用。用散列标识符值查找的速度比搜索BLOB列本身的速度快很多。

    create table t_synthetic (id varchar(100),context blob,hash_value varchar(40));

    insert into t_synthetic values(1,'beijingbeijing',md5(context));

    insert into t_synthetic values(2,repeat('beijing',2),md5(context));

    insert into t_synthetic values(3,repeat('beijing 2008',2),md5(context));

    SELECT * from t_synthetic where hash_value = MD5(repeat('beijing',2));


    合成索引的用法,由于这种技术只能用于精确匹配,在一定程度上减
    少 I/O,从而提高查询效率。如果需要对 BLOB 或者 CLOB 字段进行模糊查询,MySQL 提供了
    前缀索引,也就是只为字段的前 n 列创建索引,举例如下

    CREATE INDEX idx_blob ON t_synthetic(context(100));

    desc select * from t_synthetic where context like 'beijing%'


    在不必要的时候避免检索大型的 BLOB 或 TEXT 值。

    把 BLOB 或 TEXT 列分离到单独的表中。


    总结;
    对于字符类型,要根据存储引擎来进行相应的选择。
    对精度要求较高的应用中,建议使用定点数来存储数值,以保证结果的准确性。
    对含有 TEXT 和 BLOB 字段的表,如果经常做删除和修改记录的操作要定时执行
    OPTIMIZE TABLE 功能对表进行碎片整理。
    日期类型要根据实际需要选择能够满足应用的最小存储的日期类型。

  • 相关阅读:
    数字以万做单位——Java
    创建二维码工具类——Java
    Java 截取指定长度的字符串
    堆排序
    context:component-scan 的使用说明
    @Autowired @Resource @Qualifier的区别
    声明对象和创建对象的区别
    maven 命令
    maven 创建
    maven pom.xml文件
  • 原文地址:https://www.cnblogs.com/pangdajin/p/9541707.html
Copyright © 2020-2023  润新知