데이터를 먼저 봐라 예전에 검색테스트를 위해서 간단한 검색 엔진을 만들어본적이 있다. 포지션정보까지 넣어서 인접한 검색 결과를 찾기 위해서 어절, 형태소 포지션을 저장하도록 구현을 했는데 포지션 정보를 압축하는 알고리즘 중 word align에 기반한 세가지 방법( simple-9, relative-10, carryover-12)중 relative-10으로 구현을 .. 카테고리 없음 2008.11.13
내가 이해한 색인 압축(index compression) 요즘 관심있게 보는 색인 압축 알고리즘은 다음 세가지이다. simple-9 relative-10 carryover-12 뒤에 붙는 숫자는 32bit 안에 몇가지 방법으로 데이터가 들어가는지에 대한 것이고 각각의 이름은 상대적인 의미에서의 naming 같다. simple-9의 경우 이전에 살펴본 적이 있기 때문에 굳이 여기서 다시 설명은 하지 않.. 알고리즘 2007.03.31