어제 DB 서버 업그레이드 작업을 마무리 짖고 하루 정도 흘렀는데, 별 문제 없이 잘 돌아가네요.
어제 글을 쓴다는 것이 까먹어서 새해 첫날부터 딱딱한 이야기를 합니다. :)
이곳 DB 서버의 문자셋이 유니코드로 바뀌었습니다.
PostgreSQL 서버는 특정 문자셋 범위를 벗어난 문자열 자료는 입력자체를 거부하게 구현되어있는지라, 부득이 이제껏 EUC_KR 코드를 쓰면서 서버를 해킹해서 사용했는데, 그 부작용으로 한글 아닌 이진 자료들도 함께 입력될 수 있었습니다.
이번에 유니코드로 바꾸면서 이 문제를 원천적으로 해결했습니다. 훗날 다국어 환경으로 바뀌는 환경이 되더라도 별 무리 없이 움직일 수 있도록 그 기반을 마련한 샘입니다. 또한 훗날 한글 형태소분석기를 도입한 보다 멋진 검색 루틴을 도입하기 위한 기반작업이기도 하지요.
하지만, 웹 응용프로그램단은 아직도 확장 완성형 기반이기 때문에, 모든 문자를 다 표현할 수 있다는 것은 아닙니다. 그래서, 확장완성형 <-> 유니코드 문자셋이 서로 변환이 되는 글자들에 대해서만 입력이 가능하게 되었습니다.
다른 DB의 출력결과를 그대로 복사해서 이곳 게시판에 붙혀넣고 글을 작성하시다보면, 이런 글자들이 아닌 이진 자료나 타 문자셋 글자들이 포함될 수도 있습니다. 이때, 그냥 작성완료를 하시면 '지원하지 않는 문자가 포함되어서 글이 입력될 수 없다'고 오류 메시지를 보일 것입니다.
부득이 유럽권이나, 기타 외국어를 표현해야할 경우는 에디터의 태그사용 모드에서 &#숫자; 형태로 유니코드 값을 지정해 주시면 정상적으로 볼 수 있습니다. 물론 클라이언트가 그 글자들을 보여줄수만 있다면 말이지요. |