데이터베이스를 사랑하는 사람들의 모임 데이터베이스 사랑넷

Database

Community

자유게시판

도움주신분들

Admin

운영게시판

최근게시물

MySQL Q&A 31018 게시물 읽기

News | Q&A | Columns | Tutorials | Devel | Files | Links

No. 31018

대용량 테이블에서 count 하기
작성자	오도훈(kodachrome)	작성일	2017-01-06 12:21	조회수	7,818

약 100만개의 레코드를 가지고 있는 A, B 두개의 테이블이 있습니다.

두개의 테이블 구조는 정확하게 같고, PERSON_ID, AGE, SEX 등... 14개의 필드를 가지고 있습니다

PERSON_ID 가 두개의 테이블에서 각각 유니크 합니다.

A, B 테이블에 있는 PERSON_ID 들이 99% 정도는 같고 1% 정도가 다릅니다.

같은 PERSON_ID의 갯수와 같지 않은 PERSON_ID의 갯수를 확인하기 위해서 아래와 같은 쿼리를 시행하였습니다.

SELECT count(*) from B

WHERE B.PERSON_ID

NOT IN

(SELECT A.PERSON_ID from A)

이렇게 하니까 5초만에 9437 이라는 결과를 줍니다.

그런데....

SELECT count(*) from B

WHERE B.PERSON_ID

IN

(SELECT A.PERSON_ID from A)

이렇게 NOT IN 을 IN 으로 바꾸어서 쿼리를 실행하니까 20~30분이 지나도록 결과를 내지 못합니다.

SELECT count(*) from B

INNER JOIN A

ON B.PERSON_ID = A.PERSON_ID

이렇게 조인을 이용해도 20~30분 지나도 결과를 얻지 못했습니다.

왜 그런건가요? 두개의 테이블에서 같은 PERSON_ID의 갯수를 세는 좋은 방법은 무엇인지요?

두개의 테이블은 csv 파일을 mysql db에 넣은 거라 key나 index 가 설정되어 있지 않습니다.

감사합니다.

이 글에 대한 댓글이 총 2건 있습니다.

SELECT COUNT(*)
FROM
(SELECT DISTINCT A.PERSON_ID FROM A
INTERSECT
SELECT DISTINCT B.PERSON_ID FROM B);

MySQL 에는 INTERSECT 가 없으므로

SELECT COUNT(*) FROM
(SELECT DISTINCT A.PERSON_ID
FROM A
WHERE A.PERSON_ID IN (SELECT DISTINCT B.PERSON_ID FROM B));

이철우(leechw9)님이 2017-01-06 14:42에 작성한 댓글입니다.
이 댓글은 2017-01-06 14:57에 마지막으로 수정되었습니다.

답글 감사합니다. 아직 해결되지는 못하였습니다만,,,

error code 1248 every derived table must have its own alias

이런 에러가 나면서 쿼리 실행이 안되는군요.

아마

SELECT COUNT(*) FROM 뒤에 오는 것에 대한 alias를 설정하라는 소리인듯 하긴 한데...

혹시 도움주실수 있으면 추가 댓글 부탁드립니다.

오도훈(kodachrome)님이 2017-01-06 16:57에 작성한 댓글입니다.

No.	제목	작성자	작성일	조회
31022	mysql 쿼리 확인 요청드립니다.	홍준희	2017-01-24	7869
31021	쿼리 튜닝 요청 [6]	황성균	2017-01-23	8134
31020	나이대 구하기 [2]	궁그미	2017-01-20	7452
31018	대용량 테이블에서 count 하기 [2]	오도훈	2017-01-06	7818
31017	FULLTEXT 검색 관련 문의 드립니다.	임재송	2017-01-06	6893
31016	DB에서 각 ID(키) 별 최신 연도의 특정 값들을 합하는 쿼리를 만들고 싶습니다. [2]	오모씨	2017-01-05	6922
31013	c로 mysql 연동하고있는데 문제 해결이안되서 글올립니다. [1]	임윤택	2016-12-09	8549

All about the DATABASE... Copyleft 1999-2025 DSN, All rights reserved.

작업시간: 0.010초, 이곳 서비스는
PostgreSQL v17.5로 자료를 관리합니다