데이터베이스를 사랑하는 사람들의 모임 데이터베이스 사랑넷

인덱스 관련 질문(WHERE조건이 많을 경우)...

작성자

오래된남자(jang2000act)

작성일

2008-07-29 16:41ⓒ
2008-07-29 16:43ⓜ

조회수

8,445

Limit (cost=0.00..171.00 rows=10 width=8) (actual time=441076.031..441076.031 rows=0 loops=1)
-> Index Scan Backward using all_idx on test_table (cost=0.00..13188706.37 rows=771263 width=8) (actual time=441076.027..441076.027 rows=0 loops=1)
Index Cond: ((time >= '2008-07-01 00:00:00'::timestamp without time zone) AND (time <= '2008-07-30 23:00:00'::timestamp without time zone) AND (name = 'oldman'::bytea) AND (user = 'test'::bytea) AND (ip = 0))
Total runtime: 441076.079 ms
(4 rows)
--------------------------------------------------------------------------------------------

explain analyze 한 결과 입니다. where 조건은 약간 틀립니다...

오래된남자(jang2000act)님이 2008-07-29 17:38에 작성한 댓글입니다.

쿼리를 좀 변경해서 테스트 해보시기 바랍니다.

일단..

select time,user,ip,name from test_table as a

inner join

(

select user from test_table

where user = 'user'

) as b

on a.user = b.user

inner join

(

select ip from test_table

where ip = 'ip'

) as c

on a.ip = c.ip

inner join

(

select name from test_table

where name = 'name'

) as c

on a.ip = c.name

where

(a.time >= '2008-07-09 12:00:00') and

(a. time <= '2008-07-10 13:00:00' )

order by a.time limit 200;

이렇게 하셔서 앞조건에서 일치하지않으면 스톱을 걸수 있게 해서 한번 해보시기 바랍니다.

이게 원하는 결과가 된다면

explain analyze

SELECT time, user, ip, name FROM test_table

WHERE

( user = 'test') and

( name = 'oldman') and

( ip = 1023421 )and

( time >= '2008-07-09 12:00:00' ) and

( time <= '2008-07-10 13:00:00' )

order by time limit 200;

쿼리를 이렇게 작성하셔서 해보시기 바랍니다.

일단 쿼리를 좀 수정해서 원하는 결과값이 나오는지 한번 explain한 결과값을 올려주시기 바랍니다.

김병석(byung82)님이 2008-07-29 18:27에 작성한 댓글입니다.

time 컬럼의 값과 다른 컬럼 하나의 값만 있을땐 빠르고 (user_idx, ip_idx, name_idx)
모든 컬럼의 조건값을 넣고 조회한 경우가 느리다면 (all_idx)
time 컬럼의 데이터 분포도의 문제이거나 해당 쿼리의 time 컬럼 조건의 카디널리티가 낮은것으로 보입니다.

all_idx 인덱스의 경우만 time컬럼이 앞쪽에 위치하죠..

time >= '2008-07-09 12:00:00' and
time <= '2008-07-10 13:00:00' and

이조건만 주고 count해보세요. 아마 손익분기를 넘어서는 데이터량이 나올겁니다.

all_idx인덱스를 사용하는것이, 테이블 전체 스캔을 하거나 user_idx,ip_idx,name_idx중에 하나를 스킵스캔하는거보다 불리하다고 하면 all_idx인덱스를 사용하지 않는 실행계획이 나와야 하는데요..

아마 통계정보의 문제이거나 옵티마이저 설정값의 문제로 인해 제대로 판단을 못하는걸로 보입니다.

analyze 명령으로 해당 테이블의 통계정보를 업데이트 해주시고 다시 실행계획을 확인해보십시요.
time 컬럼의 데이터 분포도가 불량하다고 하면 all_idx 인덱스의 컬럼 순서를 조정해보세요.