검색후 결과 제목을 클릭하면 해당 페이지로 이동하는데 사용자가 클릭하는 것도 기록을 하겠지. 해당 페이지로 바로 링크가 걸려서 이동하는 것 같아서 물어 보는거다.
사실 검색 결과 랭킹시에 가장 중요한 정보 중 하나가 바로 사용자가 클릭을 어느 페이지를 하느냐 하는 것이거든. 특정 검색어에 대해서 사용자의 클릭빈도수도 페이지별로 기록해서 디비화 해 놓고 그걸 랭킹에 반영해야 할 필요성이 있는 거 같아서 물어 보는 것임.
사용자의 클릭 횟수가 인위적으로 조작하지 않는 이상은 어찌 보면 가장 큰 정보일 수도 있다고 생각한다. 클릭횟수가 만약 조작되지 않는다는 보장만 있고, 정보를 조회하는 사람이 많다는 보장만 된다면 그것만으로 랭킹을 만들수 있지 않을까 하는 생각도 해 본다.
어차피 가장 많은 사람이 찾는 자료가 가장 가능성이 높은 정보가 아닐까 생각되거든.
주제와는 사뭇 틀린 내용이긴 하지만..
전에 있던 웹메일 솔류션 개발회사 있을때..
EMS제품 개발쪽에서..
타킷도 저장을 하더군요..
즉 상대가 받은 메일을 누가 언제 몇번을 클릭했는지..
또한 2차적인 EMS발송을 위해 통계로 만들더군요..
1,2,3,4번의 마우스 이벤트가 있다면 그에따른 클릭수와 시간등
전부다 서버로 보내게 만들어서 그걸 통계로..
데이터를 만들던데요..
아마 검색엔진 이나 랭킹싸이트에서도 유사한 방법쓰지 않는가요?
오늘도 새로운 이야기네요. 재밌당~~!
검색엔진 참 신기하게만 생각했는데 ...
근데요 제가 스카우터에서 "디지탈카메라" 를 검색했는데
제가 원했던건 디시인사이드가 나올줄 알았는데
들어 보지 못했던 사이트가 처음으로 나오던데...
제 생각이 틀린건가요 ?
그건 꼭 그렇게 생각할 것만은 아닌거 같다.
물론 첫페이지에 올라오는 사이트를 많이 클릭하게 되겠지. 그런데 그건 첫페이지에 올라오는 사이트들이 오히러 자기가 찾을 사이트일 가능성이 더 높기 때문이기도 하지.
개인적으로 검색하는 경우를 한번 생각해 보자. 나같은 경우는 주로 구글을 이용하는데, 구글에서 일단 첫페이지 부터 꼼꼼하게 살펴본다. 그래서 아래 제시되는 sample 문장들 읽어 보고, 그 내용이 전혀 아니라면 아예 클릭을 안하고 다음 페이지로 넘어간다.
즉 첫페이지가 클릭될 확률은 높지만 그렇다고 해서 사용자의 클릭이라는 정보가 영 필요없는 정보는 아니라는 결론이지. 아마도 대부분의 사용자가 그러할 것이라고 생각한다.
사이트 검색엔진은 사실 지금 정도의 수준만 해도 90% 정도의 정확도를 제시한다고 생각한다. 하지만 나머지는 5%의 싸움이 아닐까 하고 생각해 본다.
그런면에서 1%를 높이기 위해서 뭔가 정확도를 높일 정보가 필요한데 그기에서 중요한 것 중 하나가 사용자의 클릭이 아닐까 생각도 해 본다. 그리고 아래에 제공되는 셈플문도 몇 바이트를 보여 줄것인가 하는 것도 적당한 수준을 찾아야 할것 같은데 내 생각에는 구글 정도의 수준이 나은것 같다. 스카우트에서 나오는 샘플문장은 조금 글자수가 작은 느낌이 든다.
여하튼 너말도 일리가 있는데 내 생각에는 무시할수 없는 정보임에는 틀림없는 것 같다.
그렇지.
내 생각에도 클릭수의 가장 큰 문제점이 사람이 적을 경우에는 크게 도움이 되지 못한다는 것이지. 그래서 나도 미리 사람이 충분히 많다는 가정하에서 말을 한거다.
랭킹 시스템에서 클릭수를 반영하도록 할때 그기에 맞추어서 알고리듬을 만들면 도움이 되지 않을까 생각중...
미련이랄것 까지야 -.-;;;
내가 뭐 검색엔진 개발하는 것도 아니구...
그냥 내 생각에는 무시할수 없는 정보일거라는 거지.
구조상의 문제가 있다면 그건 다음에 한번 들어보지. ^^;
그래도 이번 논제를 통해서 검색엔진의 많은 부분을 이해하게 된거 같네. 고마비~~