http://www.stanford.edu/class/cs276b/handouts/minhash.pdf jaccard measure : 교집합/합집합 열 : 1 2 3 4 5 6 c1 : 0 1 1 0 1 0 c2 : 1 0 1 0 1 1 sim(c1,c2 ) = 2/5 = 0.4( c1과 c2가 0인것은 제외 ) 관심사항은 c1이나 c2에 적어도 하나이상은 값이 있는 열 총 6개의 열이 있다고 할때 4번 열은 c1,c2가 0이기 때문에 제외하고 random하..