언어처리

auto tagging

고요한하늘... 2008. 10. 29. 22:53

auto tagging  : 태그를 자동으로 달아주는 것

그럼 tag는

 

①프로그램 작성에서 데이터 구조에 붙여진 1개 이상의 문자로, 그 데이터 구조에 관한 정보를 포함하고 있어서 그것을 식별할 수 있게 하는 것.

 

식별자라고 하면 될까...

 

블로그에 글을 쓰다보면 태그라는것을 기록하게 된다.

사람마다 태그에 대한 생각이 다르겠지만 보통은 이 글이 어떤 검색어로 검색이 되었으면 좋겠다 싶은 것들을 태그로 선정한다.

그것이 단어 일수도 있고 구(phrase) 일수도 있다.

 

블루문님의 글중에  연봉과 이직에 관한 5가지 진실 보면

 태그 : , , ,

위와 같이 태그가 붙어 있다.

검색어를 생각해서 정하진 않았을수도 있지만 해당 태그로 검색했을때 위 글이 검색이 된다면 나쁘지 않을 것 같다.

 

 

그럼 auto tagging이라는건 글이 주제를 담고 있는 단어 또는 구(phrase)를 자동으로 만들어 주는것 정도

아직 자연언어 처리기술이 숨어 있는 의미까지 파악해 단어 또는 구를 만들어 주는 건 어려우므로 생성은 논외( 시소러스를 쓰면 비슷하게 만들수는 있지만 )

그럼 해당 글을 대표할 수 있는 단어나 구( phrase ) 즉 태그를 찾아 주는 일을 하면 될 것 같다.

 

대표한다는건 ...?

많이 나온다고 대표하는 것은 아닐거고

다른 글에서 사용하지 않는 표현이 이 글을 대표한다?( DF가 낮은 단어 )

이 글을 다른 글과 구분 할 수는 있지만 글이 전달하려는 주제를 담고 있는 지는 알 수 없다.

 ............

continue

 

 

 

 

 

 

 

'언어처리' 카테고리의 다른 글

한국어 '어미' 종류  (0) 2009.03.04
min hash  (0) 2008.12.13
Yi Syllables - 0xa0c2  (0) 2008.10.07
Expectation Maximization  (0) 2008.09.05
제20회 한글 및 한국어 정보처리 학술대회  (0) 2008.09.01