oracle rac 常見安裝、管理錯誤

  常見安裝、管理錯誤
  1. 安裝CRS失敗,或執行root.sh報錯,可能原因:
  (1) 節點間的時間不同步,解決方法:使用ntp服務
  (2) Linux下啓用了默認的防火牆,導致執行root.sh報錯:
  Failure at final check of Oracle CRS stack.
  10
  解決方法:禁用iptables ,註釋/etc/pam.d/other ;
  # service iptables stop; # chkconfig iptables off.
  (3) 裸設備的權限問題,可能因爲操作系統重新啓動後權限發生變化。(RHEL4)
  解決方法: 把 chown oracle:dba /dev/raw/raw* 命令加入到/etc/rc.local中,每次開機自動執行
  或者修改文件/etc/udev/permissions.d/50-udev.permissions
  第113行raw/*:root:disk:0660 改成 raw/*:oracle:dba:0660
  (4) Solaris使用了包括cylinder 0的磁盤分區來存儲OCR或者vote disk。
  解決辦法:相關分區不應該包括cylinder 0,可以從1開始。
  (5) 使用的公網IP地址不可路由,
  解決方法:添加相關網關
  (6) 在/etc/hosts 中沒有loopback地址,即127.0.0.1 localhost
  (7) 主機名含有大些字母、減號或者下劃線等特殊字符;
  (8) HPUX中oracle不要使用gnu的bash,修改使用默認shell;
  (9) 檢查操作系統、第三方集羣是否是oracle官方支持的,是否需要補丁,比如在AIX5.3+HACMP上安裝
  Oracle 10g/11g RAC,oslevel就需要06及以上;
  (10) AIX平臺,需要將共享設備的reserve_policy (reserve_lock) 屬性修改爲no_reserve(no);
  (11) 所有節點看到的OCR和vote設備的路徑名應該一致,如果不一致,可以用軟連接解決;
  (12) 心跳設備問題或者ocr/votedisk 訪問問題,unix/linux查看有無/tmp/crsctl.*文件,得到錯誤信息;
  (13) 在CRS舊的安裝的環境中重新安裝失敗
  解決方法: dd清除ocr和vote disk,並使用下面語句清理舊的crs配置文件
  rm -rf /usr/tmp/.oracle /var/tmp/.oracle /tmp/.oracle /etc/oracle/* /var/opt/oracle/*
  rm -rf /etc/init.cssd /etc/init.crs* /etc/init.evmd /etc/init.d/init.cssd /etc/init.d/init.crs
  rm -rf /etc/init.d/init.crsd /etc/init.d/init.evmd /etc/rc3.d/K96init.crs /etc/rc3.d/S96init.crs
  rm -rf /etc/rc.d/rc2.d/K96init.crs /etc/rc.d/rc2.d/S96init.crs
  2 客戶端有時候報錯:
  ORA-12545: Connect failed because target host or object does not exist
  ORA-12545: 因目標主機或對象不存在, 連接失敗
  解決方法:設置local_listener初始化參數
  3 如果選擇節點界面出不來。
  (1)HACMP環境中需要檢查oracle 用戶必須在 hagsuser組裏.
  (2)如果是hacmp5.4,需要打Oracle補丁6718715;
  (3)可以使用集羣配置文件cluster CONFIGURATION FILE ,內容模板如下:
  MyCluster
  rac01 rac01-priv rac01-vip
  rac02 rac02-priv rac02-vip
  rac03 rac03-priv rac03-vip
  rac04 rac04-priv rac04-vip
  4. AIX上數據庫啓動報錯
  ora-27504 IPC error creating OSD context
  ora-27300 OS system dependent operation:sendmsg failed with status:59
  ora-27301 OS failure message:Message too long
  ora-27302 failure occurred at:sskgxpsnd1
  原因:沒有設置網絡參數udp_recvspace/udp_sendspace
  5. Windows平臺,ORA-600 [kccsbck_first]
  解決方法:關閉Media Sense(媒體感知)
  6. 系統循環重啓:
  可能是CRS導致,如果因爲crs,首先設置 crsctl disable crs 來禁止oracle crs的自動啓動。
  查看OS、crsd和cssd的對應日誌,看/tmp/下是否有crs文件 (ls -lrt /tmp/crsctl*),確定crs失敗原因。
  7. 第二個節點的數據實例無法mount,掛起或者報錯,
  原因1:使用了vendor clusterware ,libskgxn2.so文件鏈接錯誤,
  解決方法:比較兩個節點的ORACLE_HOME/lib/libskgxn2和CRS_HOME/lib/libskgxn2*都是否相同,
  如果不同需要重新link
  原因2:任何平臺Oracle 9i,沒有設置網絡參數udp參數
  導致udp_sendspace或者udp_recvspace小於 db_block_size * db_file_multiblock_read_count
  解決方法:設置對應參數,如AIX上設置udp_recvspace = 65536 udp_sendspace = 65536
  原因3:AIX/HACMP/Oracle9i,在hacmp中定義了service IP
  解決方法:在初始化參數中定義cluster_interconnects
  原因4:任何平臺,設置了錯誤的cluster_interconnects
  解決方法:檢查並糾正此參數,
  8. 建庫時不能識別裸設備;
  原因1:Oracle,10.2.0.3 ,很多平臺(比如aix和linux)有rawutl相關bug,
  解決辦法:還原10.2.0.1中的rawutl工具,該程序在 $ORACLE_HOME/bin目錄中。
  原因2:Oracle9i,AIX平臺,需要設置環境變量export PGSD_SUBSYS=grpsvcs
  9. evm資源自動報錯oac_init:2: Could not connect to server, clsc retcode = 9
  解決方法:關閉 “UDP ICMP rejections”
  /etc/rc.d/init.d/iptables stop ;chkconfig iptables off

轉載於:http://tech.it168.com/a2009/0325/269/000000269555_3.shtml
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章