auto tagging : 태그를 자동으로 달아주는 것
그럼 tag는
①프로그램 작성에서 데이터 구조에 붙여진 1개 이상의 문자로, 그 데이터 구조에 관한 정보를 포함하고 있어서 그것을 식별할 수 있게 하는 것.
식별자라고 하면 될까...
블로그에 글을 쓰다보면 태그라는것을 기록하게 된다.
사람마다 태그에 대한 생각이 다르겠지만 보통은 이 글이 어떤 검색어로 검색이 되었으면 좋겠다 싶은 것들을 태그로 선정한다.
그것이 단어 일수도 있고 구(phrase) 일수도 있다.
블루문님의 글중에 연봉과 이직에 관한 5가지 진실 보면
위와 같이 태그가 붙어 있다.
검색어를 생각해서 정하진 않았을수도 있지만 해당 태그로 검색했을때 위 글이 검색이 된다면 나쁘지 않을 것 같다.
그럼 auto tagging이라는건 글이 주제를 담고 있는 단어 또는 구(phrase)를 자동으로 만들어 주는것 정도
아직 자연언어 처리기술이 숨어 있는 의미까지 파악해 단어 또는 구를 만들어 주는 건 어려우므로 생성은 논외( 시소러스를 쓰면 비슷하게 만들수는 있지만 )
그럼 해당 글을 대표할 수 있는 단어나 구( phrase ) 즉 태그를 찾아 주는 일을 하면 될 것 같다.
대표한다는건 ...?
많이 나온다고 대표하는 것은 아닐거고
다른 글에서 사용하지 않는 표현이 이 글을 대표한다?( DF가 낮은 단어 )
이 글을 다른 글과 구분 할 수는 있지만 글이 전달하려는 주제를 담고 있는 지는 알 수 없다.
............
continue
'언어처리' 카테고리의 다른 글
한국어 '어미' 종류 (0) | 2009.03.04 |
---|---|
min hash (0) | 2008.12.13 |
Yi Syllables - 0xa0c2 (0) | 2008.10.07 |
Expectation Maximization (0) | 2008.09.05 |
제20회 한글 및 한국어 정보처리 학술대회 (0) | 2008.09.01 |