Oracle OSWatcher 소개 및 로그 읽기

Oracle® OSWatcher는 vmstat와 같은 명령에서 데이터를 수집하는 유틸리티입니다. , iostat , 상단 , ps , netstat , HP-UX® sar 및 Linux®meminfo . OSWatcher는 데이터 파일을 보관하고 자동으로 문제를 찾고 가능한 경우 문제의 근본 원인을 파악하는 데 도움을 줍니다.

소개

OSWatcher는 매시간 다음 OS 명령을 사용하여 백그라운드에서 운영 체제(OS) 통계를 수집합니다.

CPU
기억
디스크 I/O

OSWatcher는 파일을 $TFA_HOME/repository/suptools/walhall/oswbb/oracle/archive/에 씁니다. .

자동 하우스키핑이 존재하지 않기 때문에 OS 통계를 정리하기 위해 몇 일보다 오래된 파일을 자동으로 삭제하는 크론 작업을 생성해야 합니다. 예를 들어 크론 정리 작업은 다음 명령을 실행하여 10일이 지난 파일을 제거할 수 있습니다.

find $TFA_HOME/repository/suptools/walhall/oswbb/oracle/archive -name "*.*" -mtime +10 -exec rm -f {} \;

oswiostat 로그 출력 읽기

iostat인 경우 가 설치되고 OSWatcher 사용자에게 유틸리티를 실행할 권한이 있는 경우 OSWatcher 로그는 기본적으로 iostat에서 시간 단위로 출력을 수집하고 보관합니다. 명령.

iostat , 시스템 입력 및 출력 장치 부하를 모니터링하는 데 사용되는 는 다음 정보를 수집합니다.

시간
물리적 디스크 및 평균 데이터 전송 속도

출력 예시

oswiostat 로그 파일에는 다음 데이터가 포함됩니다.

기기 :기기 이름
r/s :초당 읽기
w/s :초당 쓰기 수
초초/초 :초당 읽은 킬로바이트
wsec/s :초당 쓴 킬로바이트
avgrq-sz :서비스를 기다리는 평균 트랜잭션 수
avgqu-sz :활발히 서비스되고 있는 평균 트랜잭션 수
%util :디스크가 사용 중인 시간의 백분율

다음은 oswiostat의 두 가지 예입니다. 7시간 간격으로 찍은 로그:

느린 시간에:

Time: 00:01:09

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           5.22    0.01    1.77    0.10    0.00   92.90

Device:         rrqm/s   wrqm/s   r/s   w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util

sda              10.24   101.92 10.28 29.60   569.53  1057.09    40.79     0.21    5.30   0.53   2.11
sda1              0.00     0.00  0.00  0.00     0.17     0.00   138.66     0.00   12.37   3.45   0.00
sda2             10.24   101.92 10.28 29.57   569.36  1057.09    40.81     0.21    5.30   0.53   2.11
dm-0              0.00     0.00  1.72 77.98    75.95   623.85     8.78     1.20   14.99   0.08   0.67
dm-1              0.00     0.00  0.46  2.37     3.80    18.94     8.04     0.01    2.71   0.29   0.08
dm-2              0.00     0.00  7.44 50.74   278.30   410.79    11.84     0.72   12.30   0.23   1.33
dm-3              0.00     0.00  0.00  0.00     0.15     0.00   509.61     0.00   46.78   7.53   0.00
dm-4              0.00     0.00  0.49  0.00   117.41     0.02   238.95     0.00    1.94   1.05   0.05
dm-5              0.00     0.00  0.05  0.00    10.84     0.00   230.78     0.00    2.58   1.34   0.01
dm-6              0.00     0.00  0.00  0.00     0.10     0.00   479.96     0.00   54.94   8.70   0.00

바쁜 시간에:

Time: 07:32:57

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           8.16    0.00   70.29   21.55    0.00    0.00

Device:         rrqm/s   wrqm/s   r/s   w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util

sda             163.40     7.73 2074.74 53.95 73642.61   493.47    34.83   107.13   50.07   0.47 100.07
sda1              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sda2            163.40     7.73 2074.74 53.95 73642.61   493.47    34.83   107.13   50.07   0.47 100.07
dm-0              0.00     0.00 201.03  0.86  8412.37     6.87    41.70    58.68  281.80   4.96 100.07
dm-1              0.00     0.00 180.76 26.46  1446.05   211.68     8.00    25.24  119.01   4.83 100.07
dm-2              0.00     0.00 1868.90 34.54 63913.40   276.29    33.72   332.23  172.22   0.53 100.09
dm-3              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-4              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-5              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-6              0.00     0.00  0.00  0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00

이미지 출처 :https://www.dbas-oracle.com/2013/05/How-to-Analyze-or-Read-OS-Watcher-Output-in-three-easy-steps-With-Example.html

자정의 스냅샷은 좋은 성능을 보여주고 오전 7:32의 스냅샷은 성능이 좋지 않습니다. 두 번째 스냅샷에서 다음과 같은 성능 저하를 나타냅니다.

%util에 표시된 대로 여러 디스크가 100% 사용 중입니다. 칼럼.
r/s 열은 초당 매우 높은 읽기 수를 보여줍니다.
avg-cpu %idle 통계는 시스템이 이전 스냅샷의 92%에 비해 0%의 유휴 상태임을 보여줍니다.

mpstat 로그 출력 읽기

mpstat인 경우 가 설치되고 OSWatcher 사용자에게 유틸리티를 실행할 수 있는 권한이 있는 경우 OSWatcher 로그는 기본적으로 mpstat에서 매시간 출력을 수집하고 보관합니다. 명령. 데이터베이스 관리자는 이 명령을 사용하여 중앙 처리 장치(CPU) 사용률을 모니터링합니다.

출력 예시

mpstat 로그 파일에는 다음 데이터가 포함됩니다.

CPU :어떤 CPU. 전체 시스템에서 사용 가능한 모든 CPU의 통계를 포함합니다.
%사용자 :USER 프로그램이 사용한 CPU 비율
%sys :시스템 프로그램이 사용하는 CPU 비율
%iowait :IO 대기에 의해 소비된 CPU 비율
%유휴 :유휴 시스템 리소스의 비율

다음은 mpstat의 두 가지 예입니다. 1시간 간격으로 찍은 로그:

느린 시간에:

zzz ***Tue Apr 23 06:13:44 EDT 2013 Sample interval: 5 seconds

Linux 2.6.32-400.21.1.el5uek (remote.database.com)     04/23/13

06:13:44     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

06:13:49     all    6.26    0.00    1.32    0.00    0.01    0.02    0.00   92.39  36448.70
06:13:54     all    8.17    0.00    1.92    0.01    0.00    0.05    0.00   89.86  38918.09
06:13:59     all    8.11    0.00    1.18    0.01    0.00    0.05    0.00   90.65  40989.86
06:14:04     all    8.04    0.00    1.25    0.06    0.00    0.05    0.00   90.61  40242.86
06:14:09     all    6.62    0.00    1.27    0.02    0.00    0.05    0.00   92.04  37460.32
06:14:14     all    7.56    0.00    1.47    0.02    0.00    0.02    0.00   90.94  37288.67
06:14:19     all    7.19    0.00    1.21    0.14    0.00    0.02    0.00   91.44  36947.91
06:14:24     all    6.50    0.00    1.02    0.01    0.00    0.02    0.00   92.45  35792.86
06:14:29     all    7.28    0.00    1.82    0.01    0.00    0.02    0.00   90.87  36795.42
06:14:34     all    7.37    0.02    1.20    0.02    0.00    0.01    0.00   91.37  36818.80
06:14:39     all    7.41    0.00    1.05    0.02    0.00    0.02    0.00   91.49  36874.90
06:14:44     all    7.15    0.01    1.62    0.04    0.00    0.02    0.00   91.16  35904.77
06:14:49     all    7.21    0.00    1.22    0.14    0.00    0.02    0.00   91.41  38867.73
06:14:54     all    7.31    0.00    1.00    0.00    0.00    0.03    0.00   91.65  39378.74

바쁜 시간에:

zzz ***Tue Apr 23 07:23:02 EDT 2013 Sample interval: 5 seconds

Linux 2.6.32-400.21.1.el5uek (remote.database.com)     04/23/13

07:24:20     CPU   %user   %nice    %sys %iowait    %irq   %soft  %steal   %idle    intr/s

07:24:25     all    2.74    0.00   97.16    0.00    0.00    0.10    0.00    0.00  39066.67
07:24:30     all    3.06    0.00   96.87    0.00    0.00    0.07    0.00    0.00  37637.52
07:24:37     all    3.13    0.00   96.79    0.01    0.00    0.07    0.00    0.00  36788.64
07:24:42     all    2.69    0.00   97.17    0.05    0.00    0.09    0.00    0.00  38270.04
07:24:48     all    3.86    0.01   94.92    1.02    0.00    0.20    0.00    0.00  43247.39
07:24:53     all    3.51    0.00   96.19    0.20    0.00    0.11    0.00    0.00  39887.45
07:24:59     all    4.22    0.00   93.51    2.12    0.00    0.15    0.00    0.00  40638.08
07:25:04     all    6.26    0.00   85.04    8.56    0.00    0.13    0.00    0.00  41915.79
07:25:09     all    8.69    0.00   67.31   23.85    0.00    0.11    0.00    0.03  44586.56
07:25:15     all    8.09    0.00   80.62   11.17    0.00    0.12    0.00    0.00  44321.66
07:25:21     all    7.18    0.00   71.95   20.80    0.00    0.07    0.00    0.00  35399.65
07:25:26     all    6.69    0.00   68.20   24.97    0.01    0.12    0.00    0.00  38734.99
07:25:31     all    7.11    0.01   74.71   18.09    0.00    0.08    0.00    0.00  36695.68
07:25:36     all    7.46    0.00   14.17   78.20    0.00    0.05    0.00    0.13  32934.53
07:25:50     all    9.71    0.00   23.99   66.24    0.00    0.05    0.00    0.00  33617.64
07:25:56     all    7.80    0.00   85.97    6.13    0.00    0.10    0.00    0.00  41234.83

06:13의 스냅샷은 좋은 성능을 보여주고 오전 7:32의 스냅샷은 낮은 성능을 보여줍니다. 두 번째 스냅샷에서 다음과 같은 성능 저하를 나타냅니다.

%sys 열은 97.17의 최대 사용률을 보여줍니다.
%iowait 열은 78.20의 최대 사용률을 보여줍니다.

상단 출력 읽기

상단 명령은 프로세서 활동에 대한 시간별 스냅샷을 제공합니다. 로그는 CPU 사용률의 내림차순으로 나열되는 프로세스를 표시하므로 가장 많은 CPU를 사용하는 프로세스가 먼저 나열됩니다.

시스템의 CPU 사용률이 갑자기 증가하고 프로세스 수가 변경되지 않은 경우 top 문제를 식별하는 데 도움이 될 수 있습니다.

출력 예시

부하가 증가하지 않았는데도 CPU가 급증하는 다음 시나리오를 고려하십시오.

zzz ***Tue Apr 23 03:13:44 EDT 2013 Sample interval: 5 seconds. All measurements in KB (1024 bytes)

top - 04:13:44 up 22 days, 21:12, 10 users,  load average: 65.80, 169.78, 117.65

Tasks: 2297 total,   4 running, 2229 sleeping,   0 stopped,  64 zombie

Cpu0  : 12.7%us,  2.6%sy,  0.0%ni, 84.2%id,  0.5%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  6.7%us,  2.0%sy,  0.0%ni, 91.1%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu2  :  6.4%us,  1.7%sy,  0.0%ni, 91.8%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  :  5.5%us,  1.3%sy,  0.0%ni, 93.1%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu4  :  7.6%us,  1.6%sy,  0.0%ni, 90.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu5  :  5.3%us,  1.1%sy,  0.0%ni, 93.5%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu6  : 11.8%us,  2.7%sy,  0.0%ni, 85.3%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu7  :  7.0%us,  2.2%sy,  0.0%ni, 90.6%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu8  :  5.8%us,  1.5%sy,  0.0%ni, 91.8%id,  0.8%wa,  0.0%hi,  0.1%si,  0.0%st
Cpu9  :  8.0%us,  1.7%sy,  0.0%ni, 90.0%id,  0.1%wa,  0.0%hi,  0.2%si,  0.0%st
Cpu10 :  3.8%us,  1.2%sy,  0.0%ni, 94.9%id,  0.1%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu11 :  3.6%us,  1.0%sy,  0.0%ni, 95.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

Mem:  99060540k total, 91969324k used,  7091216k free,    84044k buffers
Swap: 25165816k total, 17797404k used,  7368412k free,   609612k cached

 PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

20343 oracle    20   0 13.4g  10g 5864 R 98.4 10.7  18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root      20   0 11872 2312  656 R 98.4  0.0   0:00.68 /bin/netstat -n -p -l
 6568 root      39  19     0    0    0 R 89.9  0.0 263:39.04 [kipmi0]
30262 root      20   0 23704 3116 1048 R 11.9  0.0   0:00.15 /usr/bin/top -b -d 5 -n 720
 4921 root      RT   0  247m  86m  55m S  6.8  0.1 328:08.44 /u01/app/11.2.0.3/grid/bin/osysmond.bin
28116 oracle    20   0 2623m  71m  14m S  6.8  0.1  51:51.62 /u01/app/11.2.0.3/grid/bin/oraagent.bin
 4970 grid      RT   0  359m 176m  54m S  5.1  0.2 157:05.89 /u01/app/11.2.0.3/grid/bin/ocssd.bin
   64 root      20   0     0    0    0 S  1.7  0.0   4:39.22 [ksoftirqd/20]
 4903 root      20   0  367m  20m  13m S  1.7  0.0  26:09.97 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
 6496 root      20   0 1274m  15m  11m S  1.7  0.0  28:27.53 /u01/app/11.2.0.3/grid/bin/orarootagent.bin
 6535 oracle    20   0 1830m 263m 4620 S  1.7  0.3  88:05.31 /u01/app/oracle/product/agent12c/core/12.1.0.2.0/jdk/bin/java -Xmx128M -server -Djava.secu
 7803 oracle    -2   0 1266m  11m 4068 S  1.7  0.0   9:15.42 ora_lms0_oradb2
 7874 oracle    -2   0 1266m  15m 4188 S  1.7  0.0   9:16.20 ora_lms0_oradb2
 7999 oracle    20   0 1284m  10m 3292 S  1.7  0.0   2:49.08 ora_lmd0_oradb2
 8297 oracle    20   0 1230m 3368 2864 S  1.7  0.0   0:39.95 ora_pmon_oradb2
 8333 oracle    -2   0 1252m 2380 2108 S  1.7  0.0  13:19.99 ora_vktm_bid2
 8443 oracle    -2   0 1252m 2340 2096 S  1.7  0.0  13:21.86 ora_vktm_oradb2
 8535 oracle    20   0 1253m 2712 2412 S  1.7  0.0   0:14.28 ora_dskm_oradb2
 8727 oracle    -2   0 1266m  11m 3656 S  1.7  0.0   9:01.37 ora_lms0_im1d2
 8905 oracle    20   0 1267m  13m 3468 S  1.7  0.0   9:52.75 ora_dia0_pstd2

로그 분석:

Line zzz ***Tue Apr 23 03:13:44 EDT 2013 샘플 간격:5초. KB 단위의 모든 측정값(1024바이트) 로그가 통계를 캡처한 시간을 식별합니다.

상단 - 04:13:44 최대 22일, 21:12, 사용자 10명 마지막 재부팅 이후 22일 동안 시스템이 실행되었음을 나타냅니다.

라인 로드 평균:65.80, 169.78, 117.65 마지막 1분, 5분, 15분 동안 실행 대기열의 평균 프로세스 수를 보여줍니다. 평균 부하가 높을수록 시스템이 더 바쁩니다. 부하 평균이 크게 증가하면 문제가 있음을 나타낼 수 있습니다. 예를 들어 앞의 로그는 부하 평균 수치를 기준으로 7분 후의 로그와 비교하여 바쁜 시간을 나타냅니다. , 43.22, 75.56

줄 작업:총 2297개, 실행 4개, 잠자기 2229개, 중지 0개, 좀비 64개 :이 스냅샷 시점에 2297개의 프로세스가 있었고 2229개의 프로세스가 휴면 상태였으며 I/O 또는 시스템 호출에 의해 차단되었으며 4개는 실행 중이거나 CPU에 할당되었습니다. 실행 중인 프로세스의 수는 CPU 수를 초과할 수 없습니다. 추가로 64개의 프로세스가 좀비입니다. 즉, 죽었지만 시스템에서 완전히 정리되지 않았습니다. 프로세스의 수는 다양하지만 수가 갑자기 증가하거나 감소하면 문제를 나타낼 수 있습니다.

메모리:총 99060540k, 사용 91969324k, 여유 공간 7091216k, 버퍼 84044k 킬로바이트 단위의 RAM(Random Access Memory)이 사용 중이고 무료임을 보여줍니다. 시간이 지남에 따라 이 값이 어떻게 변하는지 확인하여 문제를 식별할 수 있습니다.

스왑:총 25165816k, 17797404k 사용, 7368412k 여유, 609612k 캐시 :RAM이 소진되면 시스템은 스왑 메모리로 전환합니다. 스왑 메모리 사용량이 지속적으로 RAM의 약 40% 이상인 경우 RAM 증가를 고려해야 합니다. 높은 스왑 사용량은 성능에 부정적인 영향을 미칩니다. 100%에 도달하면 시스템이 재부팅될 수 있습니다.

다음 CPU 라인은 이 시스템에 있는 12개 CPU의 수와 활용도를 보여줍니다.

Cpu0  : 12.7%us,  2.6%sy,  0.0%ni, 84.2%id,  0.5%wa,  0.0%hi,  0.0%si,  0.0%st
...
Cpu11 :  3.6%us,  1.0%sy,  0.0%ni, 95.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

다음 프로세스 라인은 스냅샷 시점에 실행 중인 프로세스의 세부 정보를 보여줍니다.

 PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

20343 oracle    20   0 13.4g  10g 5864 R 98.4 10.7  18:56.54 oraclevntrd2 (LOCAL=NO)
30180 root      20   0 11872 2312  656 R 98.4  0.0   0:00.68 /bin/netstat -n -p -l
 6568 root      39  19     0    0    0 R 89.9  0.0 263:39.04 [kipmi0]
30262 root      20   0 23704 3116 1048 R 11.9  0.0   0:00.15 /usr/bin/top -b -d 5 -n 720
...
 8727 oracle    -2   0 1266m  11m 3656 S  1.7  0.0   9:01.37 ora_lms0_im1d2
 8905 oracle    20   0 1267m  13m 3468 S  1.7  0.0   9:52.75 ora_dia0_pstd2

프로세스 섹션에는 다음 정보가 포함되어 있습니다.

PID :프로세스의 OS 프로세스 ID
사용자 :프로세스의 소유자
%CPU :프로세스에서 사용하는 CPU의 백분율
%MEM :메모리 사용량 비율
명령 :실행 명령

결론

OSWatcher를 사용하여 시스템 성능을 주시하고 가능한 문제를 식별할 수 있습니다. 예를 들어, 프로세스가 일정한 시간 동안 CPU를 많이 사용하고 있는지 확인하십시오. SQL 명령의 로드가 높으면 이것이 조정 대상이 될 수 있습니다. 프로세스가 많은 메모리를 사용하는 경우 이것이 정상인지 조사할 수 있습니다.

CPU, 메모리 및 디스크 I/O(예:시스템 로드)를 살펴본 후 OSWatcher에서 고려할 수 있는 다른 통계가 있습니다. OSWatcher 분석을 통해 시스템의 부하 증가를 파악하면 전투의 절반이 승리합니다.

피드백 탭을 사용하여 의견을 남기거나 질문하십시오.

참조 출처:

예제와 함께 3단계로 OSWatcher 출력을 분석하거나 읽는 방법

전문가 관리, 관리 및 구성으로 환경 최적화

Rackspace의 애플리케이션 서비스(RAS) 전문가는 광범위한 애플리케이션 포트폴리오에서 다음과 같은 전문적이고 관리되는 서비스를 제공합니다.

전자상거래 및 디지털 경험 플랫폼
전사적 자원 관리(ERP)
비즈니스 인텔리전스
Salesforce CRM(고객 관계 관리)
데이터베이스
이메일 호스팅 및 생산성

우리는 다음을 제공합니다:

편향 없는 전문성 :즉각적인 가치를 제공하는 기능에 중점을 두고 현대화 여정을 간소화하고 안내합니다.
광신적인 경험 ™:프로세스를 먼저 결합합니다. 기술 두 번째.®전담 기술 지원을 통해 포괄적인 솔루션을 제공하는 접근 방식.
타의 추종을 불허하는 포트폴리오 :광범위한 클라우드 경험을 적용하여 올바른 클라우드에서 올바른 기술을 선택하고 배포할 수 있도록 지원합니다.
민첩한 전달 :귀하의 여정에서 귀하를 만나서 귀하의 성공과 일치하도록 합니다.

시작하려면 지금 채팅하세요.