个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~
个人主页:.29.的博客
学习社区:进去逛一逛~
insert优化
:
大批量插入数据
:
如果一次性需要插入大批量数据,使用insert语句插入性能较低,此时可以使用MySQL数据库提供的load指令进行插入。操作如下:
# (命令行)客户端连接数据库时,加上参数: --local-infile
mysql --local-infile -u root -p
-- 查看从本地加载文件导入数据的开关是否开启
select @@local_infile;
-- 设置全局参数local_infile为1,表示开启从本地加载文件导入数据的开关。
set global local_infile=1;
-- 执行load指令将准备好的数据,加载到表结构中
-- 加载文件: /root/sql.log 中的数据插入表
-- 字段间使用 逗号',' 分隔
-- 行间使用 换行'\n' 分隔
load data local infile '/root/sql.log' into table `表名` fields terminated by ',' lines terminated by '\n';
数据组织方式
:
IOT
)。页分裂
:
页可以为空,也可以填充一半,也可以填充100%。每个页包含了至少2行数据(如果一行数据多大,会行溢出),根据主键排列。
分裂后插入↓
重新设置指针↓
页合并
:
当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记(flaged)为删除并且它的空间变得允许被其他记录声明使用。
当页中删除的记录达到MERGE_THRESHOLD(默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用。
合并↓
主键设计原则
:
AUTO_INCREMENT
自增主键。order by 优化
:
①. Using filesort
: 通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫FileSort排序。
②. Using index
: 通过有序索引顺序扫描直接返回有序数据,这种情况即为using index,.不需要额外排序,操作效率高。
排序效率:Using index > Using filesort
order by优化策略:
①根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。
-- 没有建立索引时,排序性能为:`Using filesort`
explain select id,age,phone from tb_user order by age,phone;
-- 为排序字段建立合适索引
create index idx_age_phone_aa on tb_user(age,phone);
-- 等价于:
create index idx_age_phone_aa on tb_user(age asc,phone asc);
-- 建立索引后,排序性能提升为:`Using index`
②尽量使用覆盖索引,非覆盖索引需要回表查询,会从Using index 变为 Using filesort。
③多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASC\DESC)。
-- 一个升序一个降序
select id,age,phone from tb_user order by age asc,phone desc;
-- 注意联合索引在创建时的规则
create index idx_age_phone_ad on tb_user(age asc,phone desc);
④如果不可避免地出现filesort,大数据量排序时,可以适当增大排序缓冲区sort_buffer_size
的大小(默认256k)。
-- 查看参数sort_buffer_size大小
show variables like 'sort_buffer_size';
-- 设置参数sort_buffer_size大小
set sort_buffer_size=自定义的大小;
根据分组字段建立合适的索引来提高效率。
分组操作时,多字段通过联合索引排序也是遵循最左前缀法则的。
-- 如何建立合适索引:建议使用联合索引,可参考上文的order by优化
一个常见又非常头疼的问题就是大数据量的分页,如:limit2000000,10
,此时需要MySQL排序前2000010记录,仅仅返回2000000到2000010的记录,其他记录丢弃,查询排序的代价非常大。
优化策略
:
一般分页查询时,通过建立覆盖索引
能够较好提升性能,可通过覆盖索引+子查询
形式进行优化。
-- 优化前:
select * from tb_sku limit 2000000,10;
-- 优化后
-- 子查询的id字段存在主键索引,order by性能得到优化
-- 根据子查询的到的主键字段id进行查询,效率高。
select s.* from
tb_sku s,(select id from tb_sku order by id limit 2000000,10) i
where s.id = i.id;
count()
:
count(*)
count(主键)
count(字段)
count(1)
需要优化的问题
: