数据库系统概论An Introduction to Database System
第九章 关系查询处理和查询优化
An Introduction to Database System
第九章 关系系统及其查询优化9.1 关系数据库系统的查询处理9.2 关系数据库系统的查询优化
9.3 代数优化9.4 物理优化 9.5 小 结
An Introduction to Database System
关系系统及其查询优化(续) 本章目的: RDBMS的查询处理步骤 查询优化的概念 基本方法和技术 查询优化分类 : 代数优化 物理优化
An Introduction to Database System
9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤 9.1.2 实现查询操作的算法示例
An Introduction to Database System
9.1.1 查询处理步骤 RDBMS查询处理阶段 :
1. 查询分析
2. 查询检查3. 查询优化
4. 查询执行
An Introduction to Database System
查询处理步骤(续)
An Introduction to Database System 查询处理步骤
1. 查询分析 对查询语句进行扫描、词法分析和语法分析 从查询语句中识别出语言符号 进行语法检查和语法分析
An Introduction to Database System
2. 查询检查
根据数据字典对合法的查询语句进行语义检查 根据数据字典中的用户权限和完整性约束定义对用户的存
取权限进行检查
检查通过后把SQL查询语句转换成等价的关系代数表达式 RDBMS一般都用查询树(语法分析树)来表示扩展的关系代
数表达式
把数据库对象的外部名称转换为内部表示An Introduction to Database System
3. 查询优化 查询优化:选择一个高效执行的查询处理策略 查询优化分类 : 代数优化:指关系代数表达式的优化 物理优化:指存取路径和底层操作算法的选择
查询优化方法选择的依据: 基于规则(rule based) 基于代价(cost based) 基于语义(semantic based)An Introduction to Database System
4. 查询执行 依据优化器得到的执行策略生成查询计划 代码生成器(code generator)生成执行查询计划的代码
An Introduction to Database System
9.1 关系数据库系统的查询处理 9.1.1 查询处理步骤
9.1.2 实现查询操作的算法示例
An Introduction to Database System
9.1.2 实现查询操作的算法示例 一、 选择操作的实现 二、 连接操作的实现
An Introduction to Database System
一、 选择操作的实现 [例1]Select * from student where <条件表达式> ;
考虑<条件表达式>的几种情况:C1:无条件; C2:Sno='200215121'; C3:Sage>20; C4:Sdept='CS' AND Sage>20;
An Introduction to Database System
选择操作的实现(续) 选择操作典型实现方法: 1. 简单的全表扫描方法
对查询的基本表顺序扫描,逐一检查每个元组是否满足选择 条件,把满足条件的元组
作为结果输出 适合小表,不适合大表
2. 索引(或散列)扫描方法
适合选择条件中的属性上有索引(例如B+树索引或Hash索引)通过索引先找到满足条件的元组主码或元组指针,再通过元 组指针直接在查询的基本表中找到元组
An Introduction to Database System
选择操作的实现(续) [例1-C2] 以C2为例,Sno=‘200215121’,并且Sno上有
索引(或Sno是散列码) 使用索引(或散列)得到Sno为‘200215121’ 元组的指针 通过元组指针在student表中检索到该学生
[例1-C3] 以C3为例,Sage>20,并且Sage 上有B+树索引 使用B+树索引找到Sage=20的索引项,以此为入口点在B+树 的顺序集上得到Sage>20的所有元组指针 通过这些元组指针到student表中检索到所有年龄大于20的学 生。
An Introduction to Database System
选择操作的实现(续) [例1-C4] 以C4为例,Sdept=‘CS’ AND Sage>20,如 果Sdept和Sage上都有索引: 算法一:分别用上面两种方法分别找到Sdept=‘CS’的一组
元组指针和Sage>20的另一组元组指针
求这2组指针的交集 到student表中检索 得到计算机系年龄大于20的学生
算法二:找到Sdept=‘CS’的一组元组指针,
通过这些元组指针到student表中检索 对得到的元组检查另一些选择条件(如Sage>20)是否满足 把满足条件的元组作为结果输出。An Introduction to Database System
二、 连接操作的实现 连接操作是查询处理中最耗时的操作之一 本节只讨论等值连接(或自然连接)最常用的实现算法 [例2] SELECT * FROM Student,SC
WHERE Student.Sno=SC.Sno;
An Introduction to Database System
连接操作的实现(续) 1. 嵌套循环方法(nested loop) 2. 排序-合并方法(sort-merge join 或merge join) 3. 索引连接(index join)方法
4. Hash Join方法
An Introduction to Database System
连接操作的实现(续)1.
嵌套循环方法(nested loop)
对外层循环(Student)的每一个元组(s),检索内层循环 (SC)中的每一个元组(sc) 检查这两个元组在连接属性(sno)上是否相等 如果满足连接条件,则串接后作为结果输出,直到外 层循环表中的元组处理完为止
An Introduction to Database System
连接操作的实现(续)2. 排序-合并方法(sort-merge join 或merge join) 适合连接的诸表已经排好序的情况
排序-合并连接方法的步骤:
如果连接的表没有排好序,先对Student表和SC表按连接属性 Sno排序
取Student表中第一个Sno,依次扫描SC表中具有相同Sno的元 组
An Introduction to Database System
连接操作的实现(续)200215121 200215122 200215123 200215124 . . . 200215121 1 92 200215121 2 85 200215121 3 88
200215122 2 90200215122 3 80. .
.
排序-合并连接方法示意图
An Introduction to Database System