형태소 분서기만을 만지작 거리다가 회사에 들어와 색인기라는것까지 건들다보니 이 둘사이의 상당한 거리감을 느꼈다. 관점의 차이일수도 있겠지만 형태소 분석기와 색인기는 완전히 다른 개념으로 접근하는 것이 바람직할것 같다. 간혹 색인기를 형태소분석기의 확장된 형태로 보는 경향이 있는데 엄밀히 말하면 색인기에는 형태소 분석기의 결과물중 필요없는 부분들이 존재하고 분석자체가 상관없기도 하다. 서로다른 목적이기 때문에 가정이 다르고 가정이 다르기 때문에 그시작점 역시 다르다 . 때문에 처음 시스템을 만들 경우 초기자원이라 할수 있는 사전구성에 많은 차이가 있음을 염두해 둬야 한다.
형태소 분석에서 중요한것이 색인기에서는 중요하지 않을수도 있고 그 반대의 경우도 존재한다. 물론 공통적인것이 존재하긴 하나 두개의 개념이 대동소이하다고 가정할때 그차이는 생각보다 작지 않다.
'프로그램' 카테고리의 다른 글
[스크랩] CVS 구축 및 관리 (0) | 2006.02.03 |
---|---|
색인기(색인어 추출기)에 필요한 토큰 분리기 (0) | 2005.12.07 |
ascii 코드 테이블 (0) | 2005.11.14 |
IT 업계를 떠나는 소프트웨어 개발자들 (0) | 2005.11.01 |
valgrind (0) | 2005.10.18 |