数据库

位置:IT落伍者 >> 数据库 >> 浏览文章

Sql语句解析过程


发布日期:2022年08月20日
 
Sql语句解析过程

为了将用户写的SQL文本转化为Oracle认识的且可执行的语句这个过程就叫做解析过程解析分为硬解析和软解析一条SQL语句在第一次被执行时必须进行硬解析

当客户端发出一条SQL语句(也可以是一个存储过程或者一个匿名PL/SQL块)进入shared pool时(注意我们从前面已经知道Oracle对这些SQL不叫做SQL语句而是称为游标因为Oracle在处理SQL时需要很多相关的辅助信息这些辅助信息与SQL语句一起组成了游标)Oracle首先将SQL文本转化为ASCII值然后根据hash函数计算其对应的hash值(hash_value)根据计算出的hash值到library cache中找到对应的bucket然后比较bucket里是否存在该SQL语句

如果不存在则需要按照我们前面所描述的获得shared pool latch然后在shared pool中的可用chunk链表(也就是bucket)上找到一个可用的chunk之后释放shared pool latch在获得了chunk以后这块chunk就可以认为是进入了library cache接下来进行硬解析过程硬解析包括以下几个步骤

对SQL语句进行文法检查看是否有文法错误比如没有写fromselect拼写错误等如果存在文法错误则退出解析过程

到数据字典里校验SQL语句涉及的对象和列是否都存在如果不存在则退出解析过程这个过程会加载dictionary cache

将对象进行名称转换比如将同名词翻译成实际的对象等比如select * from t中t是一个同名词指向hrt于是Oracle将t转换为hrt如果转换失败则退出解析过程

检查发出SQL语句的用户是否具有访问SQL语句里所引用的对象的权限如果没有权限则退出解析过程

通过优化器创建一个最优的执行计划这个过程会根据数据字典里记录的对象的统计信息来计算最优的执行计划这一步牵涉大量数学运算是最消耗CPU资源的

将该游标所产生的执行计划SQL文本等装载进library cache的heap中

在硬解析的过程中进程会一直持有library cache latch直到硬解析结束为止硬解析结束以后会为SQL语句产生两个游标一个是父游标另一个是子游标父游标里主要包含两种信息SQL文本以及优化目标(optimizer goal)父游标在第一次打开时被锁定直到其他所有的session都关闭该游标后才被解锁当父游标被锁定的时候是不能被交换出library cache的只有在解锁以后才能被交换出library cache父游标被交换出内存时父游标对应的所有子游标也被交换出library cache子游标包括游标所有的信息比如具体的执行计划绑定变量等子游标随时可以被交换出library cache当子游标被交换出library cache时Oracle可以利用父游标的信息重新构建出一个子游标来这个过程叫reload可以使用下面的方式来确定reload的比率

select *sum(reloads)/sum(pins) Reload_Ratio from v$librarycache;

一个父游标可以对应多个子游标子游标具体的个数可以从视图v$sqlarea的version_count字段体现出来而每个具体的子游标则全都在视图v$sql里体现当具体绑定变量的值与上次绑定变量的值有较大差异(比如上次执行的绑定变量值的长度是而这次执行绑定变量的值的长度是位)时或者当SQL语句完全相同但是所引用的表属于不同的用户时都会创建一个新的子游标

如果在bucket中找到了该SQL语句则说明该SQL语句以前运行过于是进行软解析软解析是相对于硬解析而言的如果解析过程中可以从硬解析的步骤中去掉一个或多个的话这样的解析就是软解析软解析分为以下三种类型

第一种是某个session发出的SQL语句与library? cache里其他session发出的SQL语句一致这时该解析过程中可以去掉硬解析中的 和 但是仍然要进行硬解析过程中的 也就是表名和列名检查名称转换和权限检查

* 第二种是某个session发出的SQL语句是该session之前发出的曾经执行过的SQL语句这时该解析过程中可以去掉硬解析中的 和 这四步但是仍然要进行权限检查因为可能通过grant改变了该session用户的权限

* 第三种是当设置了初始化参数session_cached_cursors时当某个session第三次执行相同的SQL时则会把该SQL语句的游标信息转移到该session的PGA里这样该session以后再执行相同的SQL语句时会直接从PGA里取出执行计划从而跳过硬解析的所有步骤这种情况下是最高效的解析方式但是会消耗很大的内存

我们举一个例子来说明解析SQL语句的过程在该测试中绑定变量名称相同但是变量类型不同时所出现的解析情况如下所示

首先执行下面的命令清空shared pool里所有的SQL语句

SQL> alter system flush shared_pool;

然后定义一个数值型绑定变量并为该绑定变数赋一个数值型的值以后执行具体的查询语句

SQL> variable v_obj_id number;

SQL> exec :v_obj_id := ;

SQL> select object_idobject_name from sharedpool_test

where object_id=:v_obj_id;

OBJECT_ID OBJECT_NAME

AGGXMLIMP

接下来定义一个字符型的绑定变量变量名与前面相同为该绑定变数赋一个字符型的值以后执行相同的查询

SQL> variable v_obj_id varchar();

SQL> exec :v_obj_id := ;

SQL> select object_idobject_name from sharedpool_test

where object_id=:v_obj_id;

OBJECT_ID OBJECT_NAME

AGGXMLIMP

然后我们到视图v$sqlarea里找到该SQL的父游标的信息并到视图v$sql里找该SQL的所有子游标的信息

SQL> select sql_textversion_count from v$sqlarea where

sql_text like %sharedpool_test%;

SQL_TEXT

VERSION_COUNT

select object_idobject_name from sharedpool_test where

object_id=:v_obj_id

SQL> select sql_textchild_addressaddress from v$sql

where sql_text like %sharedpool_test%;

SQL_TEXT

CHILD_ADDRESS ADDRESS

select object_idobject_name from sharedpool_test where

object_id=:v_obj_id F

BD

select object_idobject_name from sharedpool_test where

object_id=:v_obj_id FC

BD

从记录父游标的视图v$sqlarea的version_count列可以看到该SQL语句有个子游标而从记录子游标的视图v$sql里可以看到该SQL文本确实有两条记录而且它们的SQL文本所处的地址(ADDRESS列)也是一样的但是子地址(CHILD_ADDRESS)却不一样这里的子地址实际就是子游标所对应的heap 的句柄

由此我们也可以看到存在许多因素可能导致SQL语句不能共享常见的因素包括SQL文本大小写不一致SQL语句的绑定变量的类型不一致SQL语句涉及的对象名称虽然一致但是位于不同的schema下SQL的优化器模式不一致(比如添加提示修改了optimizer_mode参数等)等

上一篇:在codesmith中去掉oracle下划线

下一篇:我对ORACLE数据锁的一点体会