워드 투 벡터 (Word2Vec)
훈련을 위한 코딩 방법을 사용하여 텍스트를 디지털화하는 기존 마이닝그 중 원-핫 코딩(one-hot coding)은 단어 집합의 크기를 벡터의 크기로 표현하고 표현하고자 하는 단어의 인덱스에 1의 값을 부여하고 나머지를 표현하는 벡터 표현 방법이다. 0으로.예를 들어 다음과 같은 단어 집합이 있다고 가정해 보겠습니다.“고양이,예쁜,강아지,귀엽고…그외,놀아요”생략된 단어를 포함하여 100개의 단어가 있는 경우 고양이 단어에 대한 원-핫 인코딩은 다음과 같습니다.( 1 0 … Read more