2020년 7월 15일 수요일

프로시저 개별 쿼리 리소스 확인 방법

# 스크립트 목적
일반 쿼리의 경우 command center의 쿼리 히스토리 로그 테이블에서 개별 쿼리의 리소스가 적재 되지만,  
프로시져(함수)를 이용한 경우에는 개별 쿼리의 시스템 리소스 정보가 command center에서 개별 로그가 남지 않음

pidstat를 이용하여 쿼리 세션 ID(conxxxx)와 쿼리 번호(cmdxxx)를 기준으로 cpu, memory, disk의 리소스를 1초마다 추출
프로시저 로그와 맵핑하여 개별 쿼리의 리소스를 추출 함.
참조 링크: http://gpdbkr.blogspot.com/search/label/GPDB6_SP
이를 활용하여, 프로시져에서 어느 부분이 병목이 발생되는지 확인 가능함.

# 제약 조건
1초 미만의 쿼리의 리소스는 추출 못할 수 있으며, 시스템이 부하가 걸릴 경우 시스템 리소스 수집에서 수초가 걸릴 수 있음.

# 기타 사항
pidstat으로 최소 단위가 1초이기 때문에, 1초 동안의 리소스를 수집, 
수초 이상의 쿼리에 대해서는 시스템 리소스를 제대로 수집 함.
pidstat으로 cpu 추출하기 때문에, 때에 따라서는 cpu 개수만큼 나누기가 필요 함. 

# 사전 준비 
1) 모든 노드에 pidstat 를 사용할 있도록 sysstat를 설치해야 함.
# yum install sysstat
[root@mdw ~]# pidstat
-bash: pidstat: command not found
[root@mdw ~]# yum install sysstat
[root@mdw ~]# pidstat
Linux 3.10.0-693.el7.x86_64 (mdw) 07/16/2020 _x86_64_ (1 CPU)

11:34:29 AM   UID       PID    %usr %system  %guest    %CPU   CPU  Command
11:34:29 AM     0         1    0.04    0.04    0.00    0.08     0  systemd

2) 모든 노드의 시간 동기화 

# 스크립트 생성 및 crontab 등록
모든 노드에 적용 (마스터/스탠바이마스터/세그먼트 노드 모두)

[gpadmin@sdw1 utilities]$ pwd
/data/dba/utilities
[gpadmin@sdw1 utilities]$ cat sscmd_rsc.sh
#!/bin/bash

LOGDIR=/data/dba/utilities/statlog
mkdir -p $LOGDIR
LOGDT=`date +"%Y-%m-%d"`
HOSTNAME=`hostname`
LIMITPCNT=10
for i in `seq 1 59`
do
    TIME=`date "+%Y-%m-%d_%H:%M:%S"`
    PCNT=`ps -ef | grep pidstat | grep -v grep | wc -l`
    if [ $PCNT -lt $LIMITPCNT ]; then
        ## disk (Time, DB user, Session id, CMD no, disk r_mb/s, disk w_mb/s )
        pidstat -dl 1 1 | grep Average | grep postgres | grep con | grep cmd | awk -v host=$HOSTNAME -v date=$TIME '{print host"|"date"|"$9"|"$12"|"$14" "$4" "$5}' | awk '{MB_rd[$1] += $2/1024}{MB_wr[$1] += $3/1024} END {for ( i in MB_rd) print i"|" MB_rd[i]"|"MB_wr[i]}'  >> $LOGDIR/sscmd_disk_${LOGDT}.log 2>&1 &

        ## cpu (Time, DB user, Session id, CMD no, cpu usr%, cpu sys%, cpu tot%)
        pidstat -ul 1 1 | grep Average | grep postgres | grep con | grep cmd | awk -v host=$HOSTNAME -v date=$TIME '{print host"|"date"|"$11"|"$14"|"$16" "$4" "$5" "$7}' | awk '{usr[$1] += $2}{sys[$1] +=$3}{tot[$1] +=$4} END {for (i in usr) print i"|"usr[i]"|"sys[i]"|"tot[i]}' >> $LOGDIR/sscmd_cpu_${LOGDT}.log 2>&1 &

        ## mem (Time, DB user, Session id, CMD no, VSZ MB, RSS MB, %MEM)
        pidstat -rl 1 1 | grep Average | grep postgres | grep con | grep cmd | awk -v host=$HOSTNAME -v date=$TIME '{print host"|"date"|"$11"|"$14"|"$16" "$6" "$7" "$8}' | awk '{vsz[$1] += $2/1024}{rss[$1] +=$3/1024}{memp[$1] +=$4} END {for (i in vsz) print i"|"vsz[i]"|"rss[i]"|"memp[i]}' >> $LOGDIR/sscmd_mem_${LOGDT}.log 2>&1 &
    fi
    sleep 1
done
[gpadmin@sdw1 utilities]$ crontab -l
## disk io resource log of query session and cmd level
* * * * * /bin/bash /data/dba/utilities/sscmd_rsc.sh &
[gpadmin@sdw1 utilities]$

# 로그 샘플
[gpadmin@sdw1 statlog]$ cat sscmd_cpu_2020-07-16.log
sdw1|2020-07-16_11:41:16|gpadmin|con3618|cmd6|54.72|6.6|61.31
sdw1|2020-07-16_11:41:17|gpadmin|con3618|cmd22|48.54|11.59|60.14
sdw1|2020-07-16_11:41:18|gpadmin|con3618|cmd22|61.73|35.18|96.91
sdw1|2020-07-16_11:41:20|gpadmin|con3618|cmd22|36.45|19.33|55.8
[gpadmin@sdw1 statlog]$ cat sscmd_disk_2020-07-16.log
sdw1|2020-07-16_11:41:17|gpadmin|con3618|cmd22|0.0244141|0.167852
sdw1|2020-07-16_11:41:18|gpadmin|con3618|cmd22|0|0.859375
[gpadmin@sdw1 statlog]$ cat sscmd_mem_2020-07-16.log
sdw1|2020-07-16_11:41:16|gpadmin|con3618|cmd6|2496.09|46.9531|2.56
sdw1|2020-07-16_11:41:17|gpadmin|con3618|cmd22|2501.71|52.5312|2.89
sdw1|2020-07-16_11:41:18|gpadmin|con3618|cmd22|1876.51|44.6758|2.45
[gpadmin@sdw1 statlog]$

# external table 테이블 생성 

drop external table if exists dba.ext_sscmd_mem;
create external web  table dba.ext_sscmd_mem (
   hostname varchar(20),
   log_dttm varchar(20),
   usr      varchar(63),
   ssid     varchar(63),
   sscmd    varchar(63),
   vsz_mb    numeric,
   rss_mb    numeric,
   mem_rate  numeric
EXECUTE E'cat /data/dba/utilities/statlog/sscmd_mem_*.log' ON all
FORMAT 'text' (delimiter as '|')
ENCODING 'utf8'
SEGMENT REJECT LIMIT 100000;

drop external table if exists dba.ext_sscmd_cpu;
create external web  table dba.ext_sscmd_cpu (
   hostname varchar(20),
   log_dttm varchar(20),
   usr      varchar(63),
   ssid     varchar(63),
   sscmd    varchar(63),
   cpu_usr    numeric,
   cpu_sys    numeric,
   cpu_tot    numeric
EXECUTE E'cat /data/dba/utilities/statlog/sscmd_cpu_*.log' ON all
FORMAT 'text' (delimiter as '|')
ENCODING 'utf8'
SEGMENT REJECT LIMIT 10;

drop external table if exists dba.ext_sscmd_disk;    
create external web  table dba.ext_sscmd_disk (
   hostname varchar(20),
   log_dttm varchar(20),
   usr      varchar(63),
   ssid     varchar(63),
   sscmd    varchar(63),
   disk_r_mb    numeric,
   disk_w_mb    numeric
EXECUTE E'cat /data/dba/utilities/statlog/sscmd_disk_*.log' ON all
FORMAT 'text' (delimiter as '|')
ENCODING 'utf8'
SEGMENT REJECT LIMIT 10;

create or replace view dba.v_sscmd_rsc_detail
as
select hostname, log_dttm, usr, ssid, sscmd
, sum(cpu_usr) cpu_usr, sum(cpu_sys) cpu_sys, sum(cpu_tot) cpu_tot
, sum(disk_r_mb) disk_r_mb, sum(disk_w_mb) disk_w_mb
, sum(vsz_mb) vsz_mb, sum(rss_mb) rss_mb, sum(mem_rate) mem_rate
from (
SELECT hostname, log_dttm, usr, ssid, sscmd, cpu_usr, cpu_sys, cpu_tot
             , 0 disk_r_mb, 0 disk_w_mb, 0 vsz_mb, 0 rss_mb, 0 mem_rate
FROM dba.ext_sscmd_cpu
union all
SELECT hostname, log_dttm, usr, ssid, sscmd, 0 cpu_usr, 0 cpu_sys, 0 cpu_tot
             , disk_r_mb, disk_w_mb, 0 vsz_mb, 0 rss_mb, 0 mem_rate
FROM dba.ext_sscmd_disk
union all
SELECT hostname, log_dttm, usr, ssid, sscmd, 0 cpu_usr, 0 cpu_sys, 0 cpu_tot
             , 0 disk_r_mb, 0 disk_w_mb, vsz_mb, rss_mb, mem_rate
FROM dba.ext_sscmd_mem
     ) a 
group by hostname, log_dttm, usr, ssid, sscmd;


## 쿼리 수행시 리소스 로그 실시간 확인 
edu=# select * from dba.v_sscmd_rsc_detail
edu-# order by log_dttm, hostname;
 host|     log_dttm      |  usr  | ssid  |sscmd|cpu_usr|cpu_sys|cpu_tot |disk_r_mb|disk_w_mb| vsz_mb | rss_mb  |mem_rate
-----+-------------------+-------+-------+-----+-------+-------+--------+---------+---------+--------+---------+---------
 sdw2|2020-07-16_11:41:15|gpadmin|con3618|cmd6 |   56.4|   6.8263.26 |        0|        0| 4992.18| 92.8204 |    5.08
 sdw1|2020-07-16_11:41:16|gpadmin|con3618|cmd6 | 109.44|   13.2| 122.62 |        0|        0| 4992.18| 93.9062 |    5.12
 sdw1|2020-07-16_11:41:17|gpadmin|con3618|cmd22|  97.0823.18| 120.28 |0.0488282| 0.335704| 5003.42|105.0624 |    5.78
 sdw1|2020-07-16_11:41:18|gpadmin|con3618|cmd22| 123.4670.36| 193.82 |        0| 1.718750| 3753.02| 89.3516 |    4.90
 sdw2|2020-07-16_11:41:18|gpadmin|con3618|cmd22|  94.3435.84| 130.18 |        0| 1.147696| 5003.56|106.3984 |    5.82
 sdw2|2020-07-16_11:41:19|gpadmin|con3618|cmd22| 101.3656.14| 157.54 |        01.77164| 2502.62| 68.0234 |    3.74
 sdw1|2020-07-16_11:41:20|gpadmin|con3618|cmd22|  72.9038.66111.6 |        0|        0|       0|       0 |       0

(7 rows)

Time: 168.865 ms
edu=#

## 쿼리 수행시 세션ID, 쿼리 번호로 요약 view
drop view dba.v_sscmd_rsc_sum;
create or replace view dba.v_sscmd_rsc_sum
as
select  usr
      , replace(ssid, 'con', '')::int ssid
      , replace(sscmd, 'cmd', '')::int sscmd 
      , min(log_dttm) start_dttm, max(log_dttm) end_dttm
      , round(avg(cpu_usr)) avg_cpu_usr, round(avg(cpu_sys)) avg_cpu_sys, round(avg(cpu_tot)) avg_cpu_tot
      , round(sum(disk_r_mb)) sum_disk_r_mb, round(sum(disk_w_mb)) sum_disk_w_mb
      , round(max(vsz_mb)) max_vsz_mb, round(max(rss_mb)) max_rss_mb, round(max(mem_rate)) max_mem_rate
from  (
select hostname, log_dttm, usr, ssid, sscmd
, sum(cpu_usr) cpu_usr, sum(cpu_sys) cpu_sys, sum(cpu_tot) cpu_tot
, sum(disk_r_mb) disk_r_mb, sum(disk_w_mb) disk_w_mb
, sum(vsz_mb) vsz_mb, sum(rss_mb) rss_mb, sum(mem_rate) mem_rate
from (
SELECT hostname, log_dttm, usr, ssid, sscmd, cpu_usr, cpu_sys, cpu_tot
                     , 0 disk_r_mb, 0 disk_w_mb, 0 vsz_mb, 0 rss_mb, 0 mem_rate
FROM dba.ext_sscmd_cpu
where  hostname like 'sdw%'
union all
SELECT hostname, log_dttm, usr, ssid, sscmd, 0 cpu_usr, 0 cpu_sys, 0 cpu_tot
                     , disk_r_mb, disk_w_mb, 0 vsz_mb, 0 rss_mb, 0 mem_rate
FROM dba.ext_sscmd_disk
where  hostname like 'sdw%'
union all
SELECT hostname, log_dttm, usr, ssid, sscmd, 0 cpu_usr, 0 cpu_sys, 0 cpu_tot
                    , 0 disk_r_mb, 0 disk_w_mb, vsz_mb, rss_mb, mem_rate
FROM dba.ext_sscmd_mem
where  hostname like 'sdw%'
     ) a 
group by hostname, log_dttm, usr, ssid, sscmd
  ) b 
group by 1,2,3
;

-- 프로시저 쿼리별 리소스 확인
SELECT cts, spnm, a.usr, a.ssid, ccnt, rows
    --, query
    --, err_msg
    --, start_dttm, end_dttm
--, avg_cpu_usr, avg_cpu_sys
, avg_cpu_tot
--, sum_disk_r_mb, sum_disk_w_mb
, sum_disk_r_mb + sum_disk_w_mb  as sum_disk_mb
--, max_vsz_mb, max_rss_mb, max_mem_rate
, max_vsz_mb
FROM dba.tb_splog a
left outer join dba.v_sscmd_rsc_sum b 
on   a.ssid = b.ssid 
and  a.ccnt = b.sscmd ;

            cts     |    spnm     |   usr   | ssid | ccnt |  rows   | avg_cpu_tot | sum_disk_mb | max_vsz_mb
--------------------+-------------+---------+------+------+---------+-------------+-------------+-----------
 2020-07-16 13:14:36| udf_sp_test | gpadmin | 3618 |   82 | 4002000 |         115 |           0 |       4992
 2020-07-16 13:11:28| udf_sp_test | gpadmin | 3618 |   70 |       0 |             |             |
 2020-07-16 13:11:24| udf_sp_test | gpadmin | 3618 |   54 |    2000 |             |             |
 2020-07-16 13:11:27| udf_sp_test | gpadmin | 3618 |   62 | 4000000 |         145 |           9 |       5004
 2020-07-16 13:14:36| udf_sp_test | gpadmin | 3618 |   90 |    2000 |             |             |
 2020-07-16 13:14:40| udf_sp_test | gpadmin | 3618 |   98 | 4000000 |         150 |           6 |       5004
 2020-07-16 13:11:24| udf_sp_test | gpadmin | 3618 |   46 | 4002000 |          64 |           0 |       4992
 2020-07-16 13:14:40| udf_sp_test | gpadmin | 3618106 |       0 |             |             |
(8 rows)

-- 프로시저 쿼리별 리소스 확인
SELECT cts, spnm, a.usr, a.ssid, ccnt, rows
    , query
    --, err_msg
    --, start_dttm, end_dttm
--, avg_cpu_usr, avg_cpu_sys
, avg_cpu_tot
--, sum_disk_r_mb, sum_disk_w_mb
, sum_disk_r_mb + sum_disk_w_mb  as sum_disk_mb
--, max_vsz_mb, max_rss_mb, max_mem_rate
, max_vsz_mb
FROM dba.tb_splog a
left outer join dba.v_sscmd_rsc_sum b 
on   a.ssid = b.ssid 
and  a.ccnt = b.sscmd ;
            cts     |    spnm     |   usr   | ssid | ccnt |  rows   |                     query                     | avg_cpu_tot | sum_disk_mb | max_vsz_mb
--------------------+-------------+---------+------+------+---------+-----------------------------------------------+-------------+-------------+------------
 2020-07-16 13:14:36| udf_sp_test | gpadmin | 3618 |   82 | 4002000 | delete from  public.test_tab                  |         115 |           0 |       4992
 2020-07-16 13:11:28| udf_sp_test | gpadmin | 3618 |   70 |       0 |                                               |             |             |
 2020-07-16 13:11:24| udf_sp_test | gpadmin | 3618 |   54 |    2000 | insert into public.test_tab                  +|             |             |
                    |             |         |      |      |         |   select i, i::text                          +|             |             |
                    |             |         |      |      |         |   from   generate_series (1, 2000) i          |             |             |
 2020-07-16 13:11:27| udf_sp_test | gpadmin | 3618 |   62 | 4000000 | insert into public.test_tab                  +|         145 |           9 |       5004
                    |             |         |      |      |         |   select a.*                                 +|             |             |
                    |             |         |      |      |         |   from   public.test_tab a, public.test_tab b |             |             |
 2020-07-16 13:14:36| udf_sp_test | gpadmin | 3618 |   90 |    2000 | insert into public.test_tab                  +|             |             |
                    |             |         |      |      |         |   select i, i::text                          +|             |             |
                    |             |         |      |      |         |   from   generate_series (1, 2000) i          |             |             |
 2020-07-16 13:14:40| udf_sp_test | gpadmin | 3618 |   98 | 4000000 | insert into public.test_tab                  +|         150 |           6 |       5004
                    |             |         |      |      |         |   select a.*                                 +|             |             |
                    |             |         |      |      |         |   from   public.test_tab a, public.test_tab b |             |             |
 2020-07-16 13:11:24| udf_sp_test | gpadmin | 3618 |   46 | 4002000 | delete from  public.test_tab                  |          64 |           0 |       4992
 2020-07-16 13:14:40| udf_sp_test | gpadmin | 3618106 |       0 |                                               |             |             |
(8 rows)                                         |             |             |
(8 rows)

Time: 183.141 ms


댓글 없음:

댓글 쓰기

Greenplum Backup & Restore

Greenplum에서는 gpbackup과 gprestore를 이용해서 대량의 데이터를 병렬로 백업/병렬로 복구를 지원하고 있습니다. Full 백업이외에도 incremental 백업을 지원하고 있습니다.  - incremental 백업시에는 반드시 사전...