wu-manber algorithm Sun Wu라는 분과 Uni manber라는 분이 논문의 공동 저자라서 아마도 알고리즘 이름을 Wu-manber라고 한것 같다. 기본적인 방법론은 boyer-moore 알고리즘에 기반한다. 일반적인 문자열 방법과 다르게 패턴의 뒤에서 부터 매칭하는 부분과 문자열 비교가 실패했을때 비교한 문자열 길이만큼 jump하는 .. 알고리즘 2013.09.26
udi manber aho corasick와 함께 multi pattern matching 방법론 대가 현재 google vice president http://en.wikipedia.org/wiki/Udi_Manber Udi manber Publications : http://manber.com/publications.html http://www.academypublisher.com/proc/isip09/papers/isip09p404.pdf Commentz-Walter algorithm : aho corasick 보다 빠르다고 알려진 알고리즘 multi pattern compare : http://www... 알고리즘 2013.09.26
숫자에 3자리마다 콤마 찍기 https://groups.google.com/forum/#!original/comp.lang.c/qdkgBJCgX9s/HjIy-MURXxYJ 참고 char * add_comma( int digit, char * buf ) { char *ptr, *result; int dp, sign; result = buf; ptr = fcvt( digit, 0, &dp, &sign ); while (dp--){ *buf++ = *ptr++; if (dp % 3 == 0) *buf++ = dp ? ',' : ' '; } *buf = '\0'; return result; } C언어 2013.09.13
smoothing of NGRAM smoothing(평탄화) ngram으로 Language Model을 구축할때 데이터 부족으로 출현하지 않은 엔트리에 대해서 어떤 확률 값을 부여할지에 대한 것이 smoothing이다. 데이터가 출현하지 않았기 때문에 확률값은 0인데 0/100000 과 0/10은 다를수 있다. 따라서 분모가 되는 수에 대한 고려를 해야한다. 10만개.. 알고리즘 2013.08.29
file download <!doctype html> <html> <head> <meta charset='utf-8'> <title>download sample</title> </head> <body> <a href="http://icon.daumcdn.net/w/c/12/11/10192021148946703.png" download>png</a> <a href="http://icon.daumcdn.net/w/c/12/11/10192021148946703.png" download="sss">png</a> </body> </html> HTML 2013.08.28
로컬 프로그램 멀티 쓰레드 한대의 서버에서 아주 잘 동작하는 프로그램이 있다. 지금도 잘 동작하고 있지만 파일을 크기가 커지면 아무리 좋은 프로그램이라도 선형적으로 처리시간이 늘어난다. 서버사양도 좋아지고 멀티 코어가 일반화 되었기 때문에 최대한 코어를 사용해서 선형적으로 늘어나는 시간각을 줄.. C언어 2013.08.08
multi process read fork로 여러개의 process를 실행시키고 각각의 프로세스에서 stdin으로 문자열을 입력받을때 어느 process로 입력될지는 알수 없지만 하나의 프로세스에 하나의 입력이 보장되는지를 확인하기 위해서 다음과 같은 테스트를 했다. 결과는 보장되지 않는다.... 출력 결과를 예측할수 없고, 이런식.. C언어 2013.08.08