언어처리

what do you want?

고요한하늘... 2010. 7. 12. 19:09

 

사용자들이 입력하는 쿼리를  3일 정도 지켜본것 같다.

 

사용자들의 쿼리에는 어떤 의도가 숨어있을까....

 

한참을 보다보니 아이러니한 상황이 눈에 보였다.

자신이 무엇을 찾는지 철저하게 의도를 감춘 쿼리(싱글텀)보다 자신의 의도를 마음껏 표현한 쿼리(멀티텀)의 검색 결과가 훨씬 박하다.

 

다음 검색의 경우 full and이기 때문에 하나의 텀이라도 존재하지 않는다면 검색 결과는 없다.

다시 말하면 원하는 결과를 얻기 위해서는 검색어를 생각나는데로 입력하면 안된다.

조금 더 생각해 일반적인 표현으로,  가급적 띄어쓰기는 문법에 맞게.............

 

가끔은 틀린표현이 정답인 경우도 있다. 문법적으로는 틀렸으나 유저들이 많이 사용한다면 그 표현에 대한 검색 결과가 훨씬 풍부하고 자신이 원하는 검색 결과 역시 찾을 가능성이 높아진다.(외눈박이만 있는 곳에서 당신 눈이 두개라면 당신이 비정상일지도....)

 

검색 쿼리가 많이 길어졌다고 하지만 여전히 싱글텀이 과반을 차지 하는 상황에서 싱글텀에서 사용자 의도를 추출하는건 어쩌면 시작부터 불가능한 목표인지도 모른다.

 

그렇다고 손놓고 있을순 없고

백단에서 마이닝한 결과를 싱글텀 검색어가 들어왔을때

우리는 이 쿼리에 대해서 이런 정보를 미리 추출해 놓고 있다.

당신이 원하는 정보가 혹시 이 안에 있나요?

라고 제시해줄 수 있을 것이다. 네이트 시멘틱 검색 처럼

 

 

 

'언어처리' 카테고리의 다른 글

PLSA Implementation  (0) 2013.01.24
[스크랩] HMM ( Hidden Markov Model )  (0) 2010.07.13
intention search(의도파악)를 한다면  (0) 2010.07.09
네이버 형태소 분석 결과  (0) 2009.08.06
naive bayes classifier  (0) 2009.06.19