안녕하세요..
다른게 아니고 제가 마스터1대와 4대의 슬레이브 서버로 해서 replication 구성을 해서 1년정도 잘 사용을 했습니다..
근데 얼마전부터 슬레이브서버 4대중에서 1대가 복제가 안되서 에러가 발생한건가 살펴봐도 에러도 아니고
복제가 어떤식으로 안되냐면 슬레이브 서버에서 show slave status 해서 보면 pos 값이 예를 들어 123456 이라면
이상태에서 몇시간이 지나도 증가를 하지를 않습니다... 마스터에는 계속 데이터가 입력되서 로그가 늘어나는데도
슬레이브는 멈춘것처럼 마스터에서 데이터를 가져오지를 않네요...
그래서 slave 서버에 들어가서 top 명령어로 부하가 있나봐도 cpu점유율도 낮고 로드에버리지 값도 0.4~1.3 정도 사이에서
왔다갔다하고 slave서버에서 show slave status 하면
Slave_IO_State 는 Waiting for master to send event 라고 뜨고 별다른 에러메시지도 안보이거든요 Slave_IO_Running 도 Yes, Slave_SQL_Running 도 Yes 로 표시되고 있고
한가지 이상한건 마스터 서버에서 show processlist 쳐보니까 3대의 서버가 접속해있는건 나오는데 멈춘거처럼 된 슬레이브서버의 접속된 내용은 안보이는데
이게 원인인건지 그렇다면 왜 안나오는건지.. 통모르겠네요...
문제는 멈춘거처럼 있는 슬레이브 서버의 mysql 을 재시작해주면 다시 복제를 시작하더라구요.. 멈춘그부분부터 이어서요..
이게 어쩌다 그러면 상관이 없는데 요 2~3일 사이에 벌써 7번이 넘게 그러네요... 새벽에 회사에서 전화와서 서버 멈췄다고 그러니 잠도 제대로 못자고
완벽한 해결책까지는 바라지도 않고... 힌트만이라도 주시면 열심히 눈 부릅뜨고 찾아보겠습니다.....ㅜㅜ
참 하드공간은 널널하다 못해 텅텅 비어있고요.. 몇시간동안 top 명령실행해서 cpu 부하나 load average 값 지켜봐도 미친듯이 올라가거나
갑자기 팍 증가하거나 하지는 않습니다... |