디비를 쓰지않고 html페이지로 만들어진 사이트의 데이터를 DB화 하려고하는데
그 많은 페이지들을 일일이 디비에 옮길 수는 없겠더라구요
그래서 생각한것이 태그의 패턴을 잡아서 그 안의 내용을 잡아내려고하는데
머리속이 뒤죽박죽...혹시 html변환 프로그램이나 좀 간편히 할 수 있는 방법아시는분은
도움좀 주세요 ㅠ.ㅠ
단순한 텍스트정보일때도있고 게시판처럼 꾸며진글을 그대로 보여지게 되어야하는데..
만약 csv로 converting한다면 내용사이에 있는 ',' 까지 나타내줘야 합니다...
알고계신분 부탁드립니다.
-----------------------
역시 Perl같은 스크립트언어로 정규식을 이용하는게 편한것같네요..
전에는 그런방법을 몰랐기 때문에 ㅋ
|