検索
連載
Oracleトラブル対策の基礎知識(1):

Oracle運用の基本「ログ」を理解しよう (2/3)

本連載では、Oracle Database運用の鍵となるトラブル対処法について紹介していきます。第1回、第2回では情報収集の要となるログについて見ていきます。ログの出力情報は10gと11gとでは大きく異なる点がありますので、それぞれについても確認しておきましょう。

PC用表示
Share
Tweet
LINE
Hatena

ASMインスタンスの場合のアラート・ログ

 ASMとは、Oracle Database 10gから追加された新機能である自動ストレージ管理(Automatic Storage Management)機能です。ASMはオラクルが提供するデータベースファイルシステムであり、ディスクマネージャです。

 10gから提供されているデータベース向けのファイルシステムで、ファイルシステムそのものにディスクマネジメント機構が含まれています。

 このASMの機能の詳細については割愛しますが、ASMの機能を利用する場合、通常のデータベース同様、ASM用のインスタンスが存在し、アラート・ログが出力されます。

・ASMインスタンスにはデータファイルが存在しない=データファイル関連のログは出力されない

 ASMインスタンスのアラート・ログでは、Oracleデータベースのバージョンや初期化パラメータの情報および起動/停止などの情報については先の例と同様に出力されます。ただし、表領域の変更やログスイッチに関する情報については出力されません。

 これは、ASMインスタンス自体、インスタンスのみで構成されており、ASM用のデータファイルが存在しないためです。

・ASMインスタンスでのみ出力される情報:自動リバランス

 ASMインスタンスのアラート・ログにのみ出力される情報として、「ALTER DISKGROUP ALL MOUNT」などのASM関連コマンドの操作ログおよび自動リバランスなどの情報があります。

 自動リバランスとは、ディスクグループを構成しているディスクを削除したり、追加した際にデータの再配置を行う機能です。当然、この機能については、ASM固有の情報になるので、ASMインスタンスのアラート・ログにのみ出力されます。

  リスト2はNAS構成でのリバランス時のアラート・ログの例です(Linux環境+R10.2.0.3の場合)。

Thu Jun 12 17:46:35 2008
SQL> alter diskgroup 'DATA' add disk '/export/cfs01/oracle/data04'
Thu Jun 12 17:46:35 2008
NOTE: reconfiguration of group 2/0x23e8b0c0 (DATA), full=1
Thu Jun 12 17:46:36 2008
WARNING: ignoring disk /export/cfs01/oracle/data03 in deep discovery
NOTE: initializing header on grp 2 disk DATA_0002
NOTE: cache opening disk 2 of grp 2: DATA_0002 path:/export/cfs01/oracle/data04
NOTE: PST update: grp = 2
NOTE: requesting all-instance disk validation for group=2
Thu Jun 12 17:46:37 2008
NOTE: disk validation pending for group 2/0x23e8b0c0 (DATA)
SUCCESS: validated disks for 2/0x23e8b0c0 (DATA)
Thu Jun 12 17:46:39 2008
NOTE: PST update: grp = 2
NOTE: requesting all-instance PST refresh for group=2
Thu Jun 12 17:46:39 2008
NOTE: PST refresh pending for group 2/0x23e8b0c0 (DATA)
SUCCESS: refreshed PST for 2/0x23e8b0c0 (DATA)
Thu Jun 12 17:46:42 2008
NOTE: requesting all-instance PST refresh for group=2
Thu Jun 12 17:46:42 2008
NOTE: PST refresh pending for group 2/0x23e8b0c0 (DATA)
SUCCESS: refreshed PST for 2/0x23e8b0c0 (DATA)
Thu Jun 12 17:46:48 2008
NOTE: starting rebalance of group 2/0x23e8b0c0 (DATA) at power 5
Starting background process ARB0
Starting background process ARB1
ARB0 started with pid=21, OS id=21163
Thu Jun 12 17:46:48 2008
Starting background process ARB2
ARB1 started with pid=22, OS id=21165
Thu Jun 12 17:46:48 2008
Starting background process ARB3
ARB2 started with pid=23, OS id=21167
Thu Jun 12 17:46:48 2008
Starting background process ARB4
ARB3 started with pid=24, OS id=21169
Thu Jun 12 17:46:48 2008
NOTE: assigning ARB0 to group 2/0x23e8b0c0 (DATA)
ARB4 started with pid=25, OS id=21171
Thu Jun 12 17:46:48 2008
NOTE: assigning ARB1 to group 2/0x23e8b0c0 (DATA)
NOTE: assigning ARB2 to group 2/0x23e8b0c0 (DATA)
NOTE: assigning ARB3 to group 2/0x23e8b0c0 (DATA)
NOTE: assigning ARB4 to group 2/0x23e8b0c0 (DATA)
NOTE: stopping process ARB0
Thu Jun 12 17:46:59 2008
NOTE: stopping process ARB2
NOTE: stopping process ARB1
Thu Jun 12 17:47:31 2008
NOTE: stopping process ARB4
NOTE: stopping process ARB3
Thu Jun 12 17:47:36 2008
SUCCESS: rebalance completed for group 2/0x23e8b0c0 (DATA)
Thu Jun 12 17:47:37 2008
SUCCESS: rebalance completed for group 2/0x23e8b0c0 (DATA)
NOTE: PST update: grp = 2
NOTE: PST update: grp = 2
リスト2 Linux環境R10.2.0.3(NAS構成)でのリバランス時のアラート・ログの例

RACインスタンスの場合のアラート・ログ

 RAC(Oracle Real Application Clusters)は、複数のコンピュータを結合させ、1つのシステムを構成し、機能させるための仕組みです。

 アプリケーションのレイヤでクラスタリングを行う機構で、効率的な分散処理を実現します。

 RACでは、オラクルが独自に提供するクラスタリングソフトウェア「Oracle Cluster Ready Services(CRS)」を使用して、複数のマシン上でインスタンスを稼働させ、各マシンからアクセス可能な共有ディスクにデータファイルを作成します。

 この共有ディスク上のデータファイルを各インスタンスから共有し参照・更新することで、1つのデータベースを複数インスタンス(マシン)で構成するクラスタ型のデータベース(以下:RACデータベース)を提供しています。

 先に解説したとおり、RACデータベースは複数のマシン上でインスタンスが稼働するため、インスタンスごとにアラート・ログが作成されます。

 RACインスタンスのアラート・ログについても、初期化パラメータの情報などの出力については同様であり、表領域の変更やログスイッチなどのデータベースに対する変更も記録されます。この点は、シングル・データベースのアラート・ログと変わりはありません。

・RACインスタンスでのみ出力される情報

 RACインスタンスのみ出力される重要な情報として、RACデータベースのRECONFIGURATIONの情報が記録されます。

 RECONFIGURATIONとは、RACデータベースを構成するインスタンスの起動・停止に伴い、RACデータベースを構成するインスタンスの構成情報と付随するリソースの再構築の処理を意味します。

 このRECONFIGURATION情報が出力されることで、他ノードの起動や停止が行われたタイミングを確認できます(リスト3)。

Fri Jun  6 11:55:47 2008
Reconfiguration started (old inc 16, new inc 18)
List of nodes:
 0
 Global Resource Directory frozen
 * dead instance detected - domain 0 invalid = TRUE
 Communication channels reestablished
 Master broadcasted resource hash value bitmaps
 Non-local Process blocks cleaned out
Fri Jun  6 11:55:47 2008
 LMS 0: 0 GCS shadows cancelled, 0 closed
Fri Jun  6 11:55:47 2008
 LMS 1: 0 GCS shadows cancelled, 0 closed
 Set master node info
 Submitted all remote-enqueue requests
 Dwn-cvts replayed, VALBLKs dubious
 All grantable enqueues granted
 Post SMON to start 1st pass IR
Fri Jun  6 11:55:47 2008
 LMS 1: 99 GCS shadows traversed, 0 replayed
Fri Jun  6 11:55:47 2008
 LMS 0: 98 GCS shadows traversed, 0 replayed
Fri Jun  6 11:55:47 2008
 Submitted all GCS remote-cache requests
 Fix write in gcs resources
Reconfiguration complete
リスト3 Reconfiguration発生時のアラート・ログの出力例

 RACデータベースは、複数のインスタンスで構成されていますが、どれか1つのインスタンスのアラート・ログを管理しておけばいいというものではありません。すべてのインスタンスのアラート・ログの管理が必要となります。

・RACならではのAlart.Logの読み方を覚えておこう

 RACデータベース上で問題が発生した場合には、1つのインスタンス上の問題が他のインスタンスの処理に影響を与え、全体的な問題が発生するケースがあります。

 よって、RACデータベース上にて問題が発生した場合には、1つのインスタンスのアラート・ログにスポットを絞って確認するのではなく、時間軸で各インスタンス上のアラート・ログ を対比させながら確認する必要があります。

・定期的なクリーンアップが必須

 アラート・ログは追記型ファイルです。このため、運用時間が長くなればなるほどファイルは肥大化していきます。従って、アラート・ログは定期的に監視し、問題となるエラーなどがなければ、データベースの再起動のタイミングで削除または退避させるような運用をすることをお勧めします。

 障害時にもっとも重要な情報が含まれるトレースファイルについて、次ページで確認しておきましょう。トレースファイルには異常終了時やプロセスエラー発生時の状況が記録されています。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る