Oracle無法收集AWR報錯ORA-13516

今天在看一條應用反應說執行不出來的SQL時,發現數據庫中的AWR報告沒有自動收集,最近的還停留在9月26日的,查看當前的時間是10月20日,現在有意思了,怎麼會這樣的,默認的AWR是1個小時收集一次,保留8天(此數據庫版本爲11.2.0.4)。

下面來檢查一下AWR的設置情況:

SQL> show parameter statistics_level

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
statistics_level                     string      TYPICAL

SQL> select * from dba_hist_wr_control;

      DBID SNAP_INTERVAL                     RETENTION                  TOPNSQL
---------- -------------------------------- --------------------------- ----------
2574787718 +00000 01:00:00.0                +00008 00:00:00.0           DEFAULT

statistics_level設置爲TYPICAL:收集數據庫自動管理的所有數據。

收集間隔snap_interval爲1小時,保留時間retention爲8天。

這些設置都正常。

又想到AWR收集後存放在SYSAUX表空間中,是不是表空間滿了麼?

TABLESPACE_NAME                SIZE_G          FREE_G          USED_PCT
------------------------------ --------------- --------------- ----------
SYSAUX                                   2.78            0.51    81.50%

可以看到有雖然SYSAUX表空間不大但也還有空間,看來也不是SYSAUX表空間的問題。

再去看最近後臺的alert日誌也都是正常的日誌切換內容沒有任何的報錯的信息。

既然沒有報錯,那我手動收集一下AWR總是可以的吧,於是執行下面的語句

SQL> exec dbms_workload_repository.modify_snapshot_settings(retention=>21600);
BEGIN dbms_workload_repository.modify_snapshot_settings(retention=>21600); END;

*
ERROR at line 1:
ORA-13516: AWR Operation failed: only a subset of SQL can be issued
ORA-06512: at "SYS.DBMS_WORKLOAD_REPOSITORY", line 174
ORA-06512: at "SYS.DBMS_WORKLOAD_REPOSITORY", line 222
ORA-06512: at line 1

從上面可以看到,手動收集AWR報錯,那既然有報錯信息就可以根據報錯進行處理。

先來看看這個報錯是什麼意思

SQL> !oerr ora 13516
13516, 00000, "AWR Operation failed: %s"
// *Cause:  The operation failed because AWR is not available. The
//          possible causes are: AWR schema not yet created; AWR
//          not enabled; AWR schema not initialized; or database
//          not open or is running in READONLY or STANDBY mode.
// *Action: check the above conditions and retry the operation.

後面開始在MOS和百度進行搜索,MOS找到一篇文檔與這裏的報錯很相似,但對應的版本10.1到10.2,與我當前的版本不一致。後來看到一篇博客介紹說到AWR是由後臺進程MMON執行的收集的,於是查看服務器上的MMON進程

SQL> !ps -ef |grep mmon
  oracle 15484  2406  1 13:24:07 pts/5     0:00 grep mmon

居然沒有!

看來MMON進程是被DOWN掉了,那又是什麼時候DOWN掉的呢,又想到AWR停留在9月26日,於是去看那天的alert日誌,結果有重大發現:

8e4f173e7d678f172e660470c07c0d69.png

看到26號那天晚上對數據庫做了shutdown操作,但很快shutdown又被取消了,這過程中MMON和MMNL進程被down了,後來數據庫一直沒有重啓過,所以MMON進程就一直也沒有啓動,於是今天的問題就被發現了。

現在找到了原因,那如何解決呢?怎麼把MMON進程能夠啓起來呢?

上網查了很多,沒有找到相關的解決方法。最終的方法就是把數據庫重啓。

如果有大神知道如何在不重啓實例的情況把MMON進程啓動,希望賜教。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章