데이터베이스를 사랑하는 사람들의 모임 데이터베이스 사랑넷

Database

Community

자유게시판

도움주신분들

Admin

운영게시판

최근게시물

PostgreSQL Q&A 5124 게시물 읽기

News | Q&A | Columns | Tutorials | Devel | Files | Links

No. 5124

rtree 인덱스 질문
작성자	김상기(ioseph)	작성일	2003-12-27 12:25	조회수	2,863

fulltext index 관련 알고리즘을 한번 바꾸어 보고자

rtree 인덱스를 사용해보려고 했습니다.

(intarray 의 gist 인덱싱이 알고리즘을 rtree 인덱싱을 사용하거든요)

요지는

글번호 1번, 글 내용 '무 궁 화 꽃 이 피 었 습 니 다'

일때,

fulltext 자료는

글번호 1번, fulltext 자료 '{1,2,3,4,5,6,7,8,9,10}'

이렇게 사전자료에 있는 단어 번호를 정수형 배열로 집어넣고,

intarray @ 연산으로 찾아내는 것이였지요.

당연히 인덱스를 사용할 것이고, 정수형인지라 속도도 무진장 빠를 것이다는...

그런데, 자료가 한 수백개까지는 무난하게 잘 입력되던 놈이,

어느 순간 부터는 속도가 무지막지 걸리기 시작했습니다.

글 하나를 파싱하고, 입력하는데, 걸리는 시간이 평균 1분에서 점점 더 늦어져서는 8시간째 계속 입력되고 있네요. 입력된 글 갯수는 이제까지 2,000여개...

즉, 완벽한 실패지요. :)

원인을 보니, 정수형 배열의 인덱스를 만드는데 걸리는 시간이었습니다.

정수형 배열의 요소가 4~5개 미만일 경우는 rtree 인덱스 작업 아주 무난한데,

요소가 수십개에서 수백개로 되어버리면, 실무에서 사용하지 못할 정도의 속도가 나오네요.

혹 지리정보쪽 작업하시면서 rtree 인덱스 사용하시면서 배열의 요소가 꽤 많은 자료형을 사용하면서 인덱스를 사용해 보신 경험이 있으시면 도움을 청합니다.

이 문제를 어떻게 푸셨는지....

아무래도 vector 방식의 fulltext는 포기해야할듯 :(

이 글에 대한 댓글이 총 1건 있습니다.

이 작업은 tsearch2 작업을 해보면서 완벽하게 포기했습니다. 관심 안가져주셔도 괜찮을 듯싶습니다. tsearch2 놈이 훨씬 좋네요. :(

김상기(ioseph)님이 2003-12-28 00:35에 작성한 댓글입니다.

No.	제목	작성자	작성일	조회
5127	[질문] 'LOG: shmdt(0xe20000) failed: Invalid argument' 이거 어디서 확인하죠? [1]	황남주	2003-12-29	3125
5126	난감한 index... [6]	초보	2003-12-28	4415
5125	tsearch2 사용기 [3]	김상기	2003-12-28	6006
5124	rtree 인덱스 질문 [1]	김상기	2003-12-27	2863
5123	serial 과 index (두가지질문) [5]	초보	2003-12-27	3365
5122	[질문]serial 필드 생성시 만들어지는 시퀀스테이블... [5]	wooki	2003-12-26	3375
5120	[jdbc]pgsql7.4 윈도우에서 JDBC사용?? 안되요?? [2]	황남주	2003-12-26	2436

All about the DATABASE... Copyleft 1999-2024 DSN, All rights reserved.

작업시간: 0.019초, 이곳 서비스는
PostgreSQL v16.2로 자료를 관리합니다