记一次Oracle数据恢复过程
作者:mdxy-dxy 发布时间:2024-01-14 03:38:57
事情的起因是,一个应用升级后,某一个操作导致一个表的几个列全部被更新为同一值(忍不住又要唠叨测试的重要性)。这样的错误居然出现在应用代码中,显然是重大的BUG。那个是罪魁祸首的SQL,UPDATE语句,其WHERE条件仅仅只有一个where 1=1。
系统的维护人员称是星期五出的错,发现出错是在星期天,也就是我恢复数据的日期,与声称的出错时间已经隔了将近2天。开始尝试用flashback query恢复数据,报ORA-01555错误,此路不通。维护人员说,星期五之前的RMAN备份已经被删除了(又是一个备份恢复策略不当地例子),使用基于时间点的恢复也不可能了。剩下的一条路,只有使用log miner。还好归档文件还在数据库服务器上。
这套库是一套RAC数据库,由于没有人能确认操作发生在哪个节点,因此需要将一个节点下所有的归档复制到另一个节点上(如果没有足够的空间,可以使用NFS)。然后需要找到我们用于数据恢复的归档日志:
set linesize 170 pagesize 10000
alter session set nls_date_format='yyyy-mm-dd hh24:mi:ss';
col name for a30
col first_change for a10
col next_change for a10
select max(first_time) from v$archived_log
where first_time < to_date('200909251900','yyyymmddhh24mi'); --这里的时间为错误发生时估计的最早时间。
select sequence#,first_time,name,to_char(first_change#,'xxxxxxxx') first_change,
to_char(next_change#,'xxxxxxxx') next_change
from v$archived_log
where first_time >=to_date('200909251707','yyyymmddhh24mi')
order by 2;--这里的时间为前一SQL的max(first_time)结果
SEQUENCE# FIRST_TIME NAME FIRST_CHAN NEXT_CHANG
---------- ------------------- ------------------------------ ---------- ----------
4039 2009-09-25 17:07:10 /arch/db1_1_4039.arc 88ce7eff 88d1457c
4040 2009-09-26 12:24:52 /arch/db1_1_4040.arc 88d1457c 88d1459f
4041 2009-09-26 12:25:22 /arch/db1_1_4041.arc 88d1459f 88d156a4
4688 2009-09-26 12:37:59 /arch/db1_2_4688.arc 88d1457f 88d1464a
4689 2009-09-26 12:38:27 /arch/db1_2_4689.arc 88d1464a 88d1569c
4042 2009-09-26 12:54:44 /arch/db1_1_4042.arc 88d156a4 88d157e7
4043 2009-09-26 12:54:56 /arch/db1_1_4043.arc 88d157e7 88d1ab06
4690 2009-09-26 13:07:47 /arch/db1_2_4690.arc 88d1569c 88d1570b
4691 2009-09-26 13:08:00 /arch/db1_2_4691.arc 88d1570b 88d1ab09
4044 2009-09-26 15:27:32 /arch/db1_1_4044.arc 88d1ab06 88d1ab0d
4045 2009-09-26 15:27:35 /arch/db1_1_4045.arc 88d1ab0d 88d25091
4692 2009-09-26 15:40:36 /arch/db1_2_4692.arc 88d1ab09 88d1ab77
4693 2009-09-26 15:40:39 /arch/db1_2_4693.arc 88d1ab77 88d25094
4046 2009-09-26 22:24:07 /arch/db1_1_4046.arc 88d25091 88d250db
4047 2009-09-26 22:24:19 /arch/db1_1_4047.arc 88d250db 88d2515e
4048 2009-09-26 22:24:29 /arch/db1_1_4048.arc 88d2515e 88d25167
4049 2009-09-26 22:24:41 /arch/db1_1_4049.arc 88d25167 88d25cac
4694 2009-09-26 22:37:13 /arch/db1_2_4694.arc 88d25094 88d25147
4695 2009-09-26 22:37:25 /arch/db1_2_4695.arc 88d25147 88d2515b
4696 2009-09-26 22:37:33 /arch/db1_2_4696.arc 88d2515b 88d2516a
4697 2009-09-26 22:37:47 /arch/db1_2_4697.arc 88d2516a 88d25ca9
4050 2009-09-26 22:41:57 /arch/db1_1_4050.arc 88d25cac 88d25cde
4698 2009-09-26 22:55:01 /arch/db1_2_4698.arc 88d25ca9 88d25dcf
4699 2009-09-26 22:55:19 /arch/db1_2_4699.arc 88d25dcf 88dbd27e
set linesize 170 pagesize 10000
alter session set nls_date_format='yyyy-mm-dd hh24:mi:ss';
col name for a30
col first_change for a10
col next_change for a10
select max(first_time) from v$archived_log
where first_time < to_date('200909251900','yyyymmddhh24mi'); --这里的时间为错误发生时估计的最早时间。
select sequence#,first_time,name,to_char(first_change#,'xxxxxxxx') first_change,
to_char(next_change#,'xxxxxxxx') next_change
from v$archived_log
where first_time >=to_date('200909251707','yyyymmddhh24mi')
order by 2;--这里的时间为前一SQL的max(first_time)结果
SEQUENCE# FIRST_TIME NAME FIRST_CHAN NEXT_CHANG
---------- ------------------- ------------------------------ ---------- ----------
4039 2009-09-25 17:07:10 /arch/db1_1_4039.arc 88ce7eff 88d1457c
4040 2009-09-26 12:24:52 /arch/db1_1_4040.arc 88d1457c 88d1459f
4041 2009-09-26 12:25:22 /arch/db1_1_4041.arc 88d1459f 88d156a4
4688 2009-09-26 12:37:59 /arch/db1_2_4688.arc 88d1457f 88d1464a
4689 2009-09-26 12:38:27 /arch/db1_2_4689.arc 88d1464a 88d1569c
4042 2009-09-26 12:54:44 /arch/db1_1_4042.arc 88d156a4 88d157e7
4043 2009-09-26 12:54:56 /arch/db1_1_4043.arc 88d157e7 88d1ab06
4690 2009-09-26 13:07:47 /arch/db1_2_4690.arc 88d1569c 88d1570b
4691 2009-09-26 13:08:00 /arch/db1_2_4691.arc 88d1570b 88d1ab09
4044 2009-09-26 15:27:32 /arch/db1_1_4044.arc 88d1ab06 88d1ab0d
4045 2009-09-26 15:27:35 /arch/db1_1_4045.arc 88d1ab0d 88d25091
4692 2009-09-26 15:40:36 /arch/db1_2_4692.arc 88d1ab09 88d1ab77
4693 2009-09-26 15:40:39 /arch/db1_2_4693.arc 88d1ab77 88d25094
4046 2009-09-26 22:24:07 /arch/db1_1_4046.arc 88d25091 88d250db
4047 2009-09-26 22:24:19 /arch/db1_1_4047.arc 88d250db 88d2515e
4048 2009-09-26 22:24:29 /arch/db1_1_4048.arc 88d2515e 88d25167
4049 2009-09-26 22:24:41 /arch/db1_1_4049.arc 88d25167 88d25cac
4694 2009-09-26 22:37:13 /arch/db1_2_4694.arc 88d25094 88d25147
4695 2009-09-26 22:37:25 /arch/db1_2_4695.arc 88d25147 88d2515b
4696 2009-09-26 22:37:33 /arch/db1_2_4696.arc 88d2515b 88d2516a
4697 2009-09-26 22:37:47 /arch/db1_2_4697.arc 88d2516a 88d25ca9
4050 2009-09-26 22:41:57 /arch/db1_1_4050.arc 88d25cac 88d25cde
4698 2009-09-26 22:55:01 /arch/db1_2_4698.arc 88d25ca9 88d25dcf
4699 2009-09-26 22:55:19 /arch/db1_2_4699.arc 88d25dcf 88dbd27e
尝试找到数据被错误更新的时间点:
exec sys.dbms_logmnr.add_logfile(logfilename=>'/arch/db1_1_4038.arc');
exec sys.dbms_logmnr.add_logfile(logfilename=>'/arch/db1_1_4039.arc');
exec sys.dbms_logmnr.start_logmnr(options=>sys.dbms_logmnr.dict_from_online_catalog);
col sql_redo for a50
select scn,timestamp,username,sql_redo from v$logmnr_contents
where operation='UPDATE' and upper(sql_redo) like '%TBL_FORM_FORM%'
and sql_redo like '%SGS0900021BNc10%' --这个值是UPDATE时某一列被更新后的值,用在这里便于查找。
order by scn,timestamp;
exec sys.dbms_logmnr.end_logmnr;
exec sys.dbms_logmnr.add_logfile(logfilename=>'/arch/db1_1_4038.arc');
exec sys.dbms_logmnr.add_logfile(logfilename=>'/arch/db1_1_4039.arc');
exec sys.dbms_logmnr.start_logmnr(options=>sys.dbms_logmnr.dict_from_online_catalog);
col sql_redo for a50
select scn,timestamp,username,sql_redo from v$logmnr_contents
where operation='UPDATE' and upper(sql_redo) like '%TBL_FORM_FORM%'
and sql_redo like '%SGS0900021BNc10%' --这个值是UPDATE时某一列被更新后的值,用在这里便于查找。
order by scn,timestamp;
exec sys.dbms_logmnr.end_logmnr;
很不幸的是,没有找着需要的数据。再往后找了几个日志,也没找着。
如果一直找下去,显然会消耗比较长的时间,业务也已经停止了。不过可以用一种简单的方法来查找数据被错误更新发生的时间:一个比较大的表,通常段头后面的那个块,也就是存储那个表的数据的第1个块,通常是很少更新的,至少当时恢复的那个表是这样一种情况。我们可以通过数据块中ITL上的事务SCN来满足我们的要求。
SQL> select tablespace_name,extent_id,file_id,block_id,blocks
from dba_extents where owner='XXX'
and segment_name='TBL_FORM_FORM'
order by extent_id;
TABLESPACE_NAME EXTENT_ID FILE_ID BLOCK_ID BLOCKS
---------------- ---------- ---------- ---------- -------
XXXX 0 16 25481 128
XXXX 1 17 23433 128
XXXX 2 18 21385 128
XXXX 3 19 19977 128
XXXX 4 16 23945 128
XXXX 5 17 8585 128
XXXX 6 18 14217 128
XXXX 7 19 18825 128
SQL> alter system dump datafile 16 block 25482;
System altered.
Start dump data blocks tsn: 4 file#: 16 minblk 25482 maxblk 25482
buffer tsn: 4 rdba: 0x0400638a (16/25482)
scn: 0x0000.88e21027 seq: 0x02 flg: 0x00 tail: 0x10270602
frmt: 0x02 chkval: 0x0000 type: 0x06=trans data
Block header dump: 0x0400638a
Object id on Block? Y
seg/obj: 0x40d8 csc: 0x00.88e20c40 itc: 2 flg: - typ: 1 - DATA
fsl: 0 fnx: 0x0 ver: 0x01
Itl Xid Uba Flag Lck Scn/Fsc
0x01 0x0010.011.0006ed74 0x03c002a0.2f48.07 C--- 0 scn 0x0000.88d7af30
0x02 0x0012.019.000027e0 0x03c00ede.05de.42 C--- 0 scn 0x0000.44e2ee39
SQL> select tablespace_name,extent_id,file_id,block_id,blocks
from dba_extents where owner='XXX'
and segment_name='TBL_FORM_FORM'
order by extent_id;
TABLESPACE_NAME EXTENT_ID FILE_ID BLOCK_ID BLOCKS
---------------- ---------- ---------- ---------- -------
XXXX 0 16 25481 128
XXXX 1 17 23433 128
XXXX 2 18 21385 128
XXXX 3 19 19977 128
XXXX 4 16 23945 128
XXXX 5 17 8585 128
XXXX 6 18 14217 128
XXXX 7 19 18825 128
SQL> alter system dump datafile 16 block 25482;
System altered.
Start dump data blocks tsn: 4 file#: 16 minblk 25482 maxblk 25482
buffer tsn: 4 rdba: 0x0400638a (16/25482)
scn: 0x0000.88e21027 seq: 0x02 flg: 0x00 tail: 0x10270602
frmt: 0x02 chkval: 0x0000 type: 0x06=trans data
Block header dump: 0x0400638a
Object id on Block? Y
seg/obj: 0x40d8 csc: 0x00.88e20c40 itc: 2 flg: - typ: 1 - DATA
fsl: 0 fnx: 0x0 ver: 0x01
Itl Xid Uba Flag Lck Scn/Fsc
0x01 0x0010.011.0006ed74 0x03c002a0.2f48.07 C--- 0 scn 0x0000.88d7af30
0x02 0x0012.019.000027e0 0x03c00ede.05de.42 C--- 0 scn 0x0000.44e2ee39
从上面的结果可以看到,数据块的ITL中,最新的事务其SCN为88d7af30,正处于最后一个归档日志的first_change#和last_change#之间,即88d25dcf和88dbd27e之间,难不成这个错误是今天早上才发生的?于是我挖掘最后1个归档日志,结果发生错误的确是发生在早上,也就是我开始进行恢复操作之前半个小时。
既然错误并没有发生太久,同时这个系统也允许一定的数据丢失,那就使用flashback query,得到UPDATE操作之前的数据即可。
create table tbl_form_form_new
as select * from tbl_form_form
as of timestamp to_date('2009-09-27 09:08:00','yyyy-mm-dd hh24:mi:ss');
--当然这里也可以按SCN进行闪回。
create table tbl_form_form_new
as select * from tbl_form_form
as of timestamp to_date('2009-09-27 09:08:00','yyyy-mm-dd hh24:mi:ss');
--当然这里也可以按SCN进行闪回。
幸运的是,这次闪回查询成功了。看起来足够大的UNDO表空间还是有好处,至少我已经有数次用闪回查询来恢复数据。


猜你喜欢
- 就是一个简单的python查询百度关键词排名的函数,以下是一些简介:1、UA随机2、操作简单方便,直接getRank(关键词,域名)就可以了
- 1. 从字典创建DataFrame>>> import pandas>>> dict_a = {'
- 异常的传递性在 Python 中,异常的传递性指的是,当一个异常没有被处理时,它会沿着调用栈向上抛出,直到被处理或者导致程序崩溃。具体来说,
- 前言:.net6LTS版本发布已经有若干天了。此处做一个关于使用.net6开发精简版webapi(minimalapi)的入门教程,以及VS
- 本文实例为大家分享了python(列表生成式/器)的具体代码,供大家参考,具体内容如下一、列表生成式#列表生成式是快速生成一个列表的一些公式
- 【基本介绍】【格式】:pivot(聚合函数 for 需要转为列的字段名 in(需要转为列的字段值))【说明】:实现将指定字段的字段值转换为列
- 一、准备训练数据主要的数据有两个:1.小黄鸡的聊天语料:噪声很大2.微博的标题和评论:质量相对较高二、数据的处理和保存由于数据中存到大量的噪
- javascript单线程JavaScript的单线程,与它的用途有关。作为浏览器脚本语言,JavaScript的主要用途是与用户互动,以及
- requests库简介requests 库是一个常用的用于 http 请求的模块,它使用 python 语言编写,可以方便的对网页进行爬取,
- 插入一条记录后,如何得到最新的自动增加ID?我们要用到SQL Server的@@IDENTITY。它能够记录下系统最近使用的一个IDENTI
- 背景近期看到一篇文章,真的感叹作者的洞察力,在开发时有可能就会犯这样的错误,所以一定要多学习,多实践。其问题就是你在提交事务时,如果中间有其
- 本文为大家分享了python银行管理系统的具体代码,供大家参考,具体内容如下自己写的练手小程序,练习面向对象的概念,代码中都有注释,刚学的同
- 前言快过年了,又到了公司年底评级的时候了。今年的评级和往常一下,每个人都要填写公司的民主评议表,给各个同事进行评价打分,然后部门收集起来根据
- 楔子我们知道python的执行效率不是很高,而且由于GIL的原因,导致python不能充分利用多核CPU。一般的解决方式是使用多进程,但是多
- 前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。闲来无事听听歌,听
- asp之家注:长文章分页算是asp编程中一个比较经典单位问题,怎么分页,什么时候分页.方法挺多,有的是人为的加入分页标志,有的是程序自动加分
- 今天我将教大家如何用哈希函数将密码加密加密后的密码是很难倒推的~普通加密:首先调用函数hashlibimport hashlib然后使用哈希
- 线性插值插值:是根据已知的数据序列(可以理解为你坐标中一系列离散的点),找到其中的规律,然后根据找到的这个规律,来对其中尚未有数据记录的点进
- 最近使用工作需要,使用了Navicat8.2版本,发现备份数据都是默认存储在C盘,这个就比较郁闷了。重做系统忘记转移了。那不就死定了?找了一
- 一.Numpy库1.什么是numpy?numpy是python进行科学计算的一个基础软件包,他是一个python库,提供多维数组