One-Hot Encoding

범주형 변수를 컴퓨터가 인식할 수 있게 해주기 위해서는 따로 encoding 과정을 거쳐야 한다. 범주형 변수란? - 연속형 변수가 아닌 것을 의미한다. 연속하지 않기 때문에 그래프로 표현하게 되면 아래 그래프와 같이 뚝뚝 끊기게 나타난다. ex ) grade , state , job 대표적으로는 One - Hot Encoding Ordinal - Encoding Label Encoding Target Encoding Binary Encoding 등 다용한 종류가 존재한다. 단어 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 단어의 인덱스에 1의 값을 부여하며 다른 인덱스에는 0을 부여하는 단어의 벡터 표현 방식이다. (고유 값의 개수만큼 컬럼을 만든다는 특징이 있다. ) pd.get_dummies..
ERE
'One-Hot Encoding' 태그의 글 목록