本文主要给初学者关于关系数库的一个浮光掠影式的介绍,如果想深入理解,必须对于下文提到的每个内容单独深入学习!
it-information technology的简称,中文是信息机技术,信息其实就是数据。
要处理数据,则至少涉及到几个方面:
1)表达
2)存取
3)计算
4)安全
当然还是其它方面!
其中第二点就是数据库的核心任务。
一个工业级的产品远远不是这个,还有:
1)网络
2)并发
3)性能
4) 编程
5)安全(包括数据加密+和存取权限等)
6)备份/恢复
7)高可靠
8)兼容
等等,每一个都是可以深入研究的!
随着数据库的发展,数据库越来越自治(优化、高可靠等等),对于普通的dba而言,比以前轻松了不少。
对于大部分的程序员来说,必须和数据库做交互,无论是后端还是前端
本文阐述的是传统关系数据库,重点阐述几点:
1)安装
2)备份恢复
3)编程(sql)
这些都是非常基础的,属于程序员必须掌握的基本技能!
一、安装
程序员的最基本要求,不会装那么就没有什么可说!具体略,要强调的是,应该要回安装各个操作系统,此外会安装集群版本!
安装的基本步骤:
1.确认功能范围
2.确认是免费还是付费
3.下载安装包
4.安装
5配置
6.创建有关管理员账号
7.配置网络和安全
二、备份恢复
冷备份可不要求,专业不备份也不要求,但至少要求会逻辑备份和恢复!
oracle,要懂得expdp/impdp,mysql要懂得mysqldump,sqlserver要懂得bcp等。
三、编程
要熟悉sql语句,则必须了解几个基本的内容:
1.关系数据库概念
2.数据存储原理,不同rdbms的存储方式不一样,所以学新的一种,就必须了解特定一种的存储方式
3.sql语言
4.sql-iso标准和不同厂家的实现
1,2,3是必须掌握的,缺少一个,都难于编写合格的sql语句!
此外,许多概念也需要掌握:范式、索引、分区、视图、元数据、锁、缓存、基本的算法(FIFO,LRU等等)、分布式数据库等等。
本文就Mysql8.x和oracle 12c的进行举例!
3.1 关系数据库概念
重点是“关系”,或者可以理解为表格,可以有多个列和行。
不同于kv模式数据库,也不同于基于hdfs的大数据,更不同于现在所谓的区块链数据库!
关系数据库关键要满足acid:
a:原子性,事务要么完成,要么不完成
c:一致性,关联数据应该符合商业逻辑,事务前后必须保持数据的完整性。理解上可以参考能量守恒定律,个人财务收支!
i:隔离性,一个事务不影响另外一个事务,可以简单理解事务互不影响
d:持久性,就是数据据要落地,并存储在特定介质上,不能总是带电状态下才有!
ad容易理解,但ic不那么容易,需要阅读较多文档才能深刻体会!
注意:关系数据库都遵循acid,但不同产品的实现方式可以不一,表现上也有差异!
3.2数据存储
数据怎么存,是相当复杂的事情,因为这影响了许多方面:
1.性能
2.安全和备份
3.数据表现
例如:oracle12c
mysql-innodb
其实存储和性能的关系,可以联想图书馆找书,城市规划等场景,这就是我们常说的“大道相通",或者是理论来自于实践!
书本怎么放才能更快找到,更节省空间,更加安全等等?
城市交通应该怎么规划,才能达到最大的容量,同时又能够有益于大部分人?
数据库物理和逻辑存储的设计对于提高系统性能是相当之关键,是相对比较复杂的。
看看mysql和oracle的create table语句,就可以i体会到存储是重要的,需要学习的内容是很多的。
oracle:https://docs.oracle.com/en/database/oracle/oracle-database/19/sqlrf/CREATE-TABLE.html#GUID-F9CE0CC3-13AE-4744-A43C-EAC7A71AAAB6
mysql: https://dev.mysql.com/doc/refman/8.0/en/create-table.html
把这个命令贴一些出来,估计看了头皮一紧:
mysql:
CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name (create_definition,...) [table_options] [partition_options] CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name [(create_definition,...)] [table_options] [partition_options] [IGNORE | REPLACE] [AS] query_expression CREATE [TEMPORARY] TABLE [IF NOT EXISTS] tbl_name { LIKE old_tbl_name | (LIKE old_tbl_name) } create_definition: col_name column_definition | {INDEX|KEY} [index_name] [index_type] (key_part,...) [index_option] ... | {FULLTEXT|SPATIAL} [INDEX|KEY] [index_name] (key_part,...) [index_option] ... | [CONSTRAINT [symbol]] PRIMARY KEY [index_type] (key_part,...) [index_option] ... | [CONSTRAINT [symbol]] UNIQUE [INDEX|KEY] [index_name] [index_type] (key_part,...) [index_option] ... | [CONSTRAINT [symbol]] FOREIGN KEY [index_name] (col_name,...) reference_definition | check_constraint_definition column_definition: data_type [NOT NULL | NULL] [DEFAULT {literal | (expr)} ] [AUTO_INCREMENT] [UNIQUE [KEY]] [[PRIMARY] KEY] [COMMENT 'string'] [COLLATE collation_name] [COLUMN_FORMAT {FIXED|DYNAMIC|DEFAULT}] [STORAGE {DISK|MEMORY}] [reference_definition] [check_constraint_definition] | data_type [COLLATE collation_name] [GENERATED ALWAYS] AS (expr) [VIRTUAL | STORED] [NOT NULL | NULL] [UNIQUE [KEY]] [[PRIMARY] KEY] [COMMENT 'string'] [reference_definition] [check_constraint_definition] data_type: (see Chapter 11, Data Types) key_part: {col_name [(length)] | (expr)} [ASC | DESC] index_type: USING {BTREE | HASH} index_option: KEY_BLOCK_SIZE [=] value | index_type | WITH PARSER parser_name | COMMENT 'string' | {VISIBLE | INVISIBLE} check_constraint_definition: [CONSTRAINT [symbol]] CHECK (expr) [[NOT] ENFORCED] reference_definition: REFERENCES tbl_name (key_part,...) [MATCH FULL | MATCH PARTIAL | MATCH SIMPLE] [ON DELETE reference_option] [ON UPDATE reference_option] reference_option: RESTRICT | CASCADE | SET NULL | NO ACTION | SET DEFAULT table_options: table_option [[,] table_option] ... table_option: AUTO_INCREMENT [=] value | AVG_ROW_LENGTH [=] value | [DEFAULT] CHARACTER SET [=] charset_name | CHECKSUM [=] {0 | 1} | [DEFAULT] COLLATE [=] collation_name | COMMENT [=] 'string' | COMPRESSION [=] {'ZLIB'|'LZ4'|'NONE'} | CONNECTION [=] 'connect_string' | {DATA|INDEX} DIRECTORY [=] 'absolute path to directory' | DELAY_KEY_WRITE [=] {0 | 1} | ENCRYPTION [=] {'Y' | 'N'} | ENGINE [=] engine_name | INSERT_METHOD [=] { NO | FIRST | LAST } | KEY_BLOCK_SIZE [=] value | MAX_ROWS [=] value | MIN_ROWS [=] value | PACK_KEYS [=] {0 | 1 | DEFAULT} | PASSWORD [=] 'string' | ROW_FORMAT [=] {DEFAULT|DYNAMIC|FIXED|COMPRESSED|REDUNDANT|COMPACT} | STATS_AUTO_RECALC [=] {DEFAULT|0|1} | STATS_PERSISTENT [=] {DEFAULT|0|1} | STATS_SAMPLE_PAGES [=] value | TABLESPACE tablespace_name [STORAGE {DISK|MEMORY}] | UNION [=] (tbl_name[,tbl_name]...) partition_options: PARTITION BY { [LINEAR] HASH(expr) | [LINEAR] KEY [ALGORITHM={1|2}] (column_list) | RANGE{(expr) | COLUMNS(column_list)} | LIST{(expr) | COLUMNS(column_list)} } [PARTITIONS num] [SUBPARTITION BY { [LINEAR] HASH(expr) | [LINEAR] KEY [ALGORITHM={1|2}] (column_list) } [SUBPARTITIONS num] ] [(partition_definition [, partition_definition] ...)] partition_definition: PARTITION partition_name [VALUES {LESS THAN {(expr | value_list) | MAXVALUE} | IN (value_list)}] [[STORAGE] ENGINE [=] engine_name] [COMMENT [=] 'string' ] [DATA DIRECTORY [=] 'data_dir'] [INDEX DIRECTORY [=] 'index_dir'] [MAX_ROWS [=] max_number_of_rows] [MIN_ROWS [=] min_number_of_rows] [TABLESPACE [=] tablespace_name] [(subpartition_definition [, subpartition_definition] ...)] subpartition_definition: SUBPARTITION logical_name [[STORAGE] ENGINE [=] engine_name] [COMMENT [=] 'string' ] [DATA DIRECTORY [=] 'data_dir'] [INDEX DIRECTORY [=] 'index_dir'] [MAX_ROWS [=] max_number_of_rows] [MIN_ROWS [=] min_number_of_rows] [TABLESPACE [=] tablespace_name] query_expression: SELECT ... (Some valid select or union statement)
顺便说下:如果英文不过关,那么学好计算机还是有一定难度的!毕竟许多资料是英文的!
3.3 sql语句
标准sql语句,尤其是ddl,dml语句谈不上复杂,准确说,应该是相对很简单的。
如果有什么稍微难一些的就是 集合运算,譬如 inner join ,left join,full join,但也很容易理解!
总结
要写好sql语句,需要长时间训练,从数据库基础开始,到熟练写出每个sql语句!
学习之后,写不出每个sql语句,属于资质问题;写不出好的sql语句,可能是学习不够,也可能是资质问题!