파이썬

데이터 분석 전 아주 기본적인 전처리를 해봅시다! 데이터 전처리에 앞서. 전체적인 순서를 정리해보면 아래와 같습니다. (코랩기준!!) -사실 간단한 전처리는 코랩보다 jupyter notebook으로 로컬에서 직접 작업하는 것이 좀 더 편리한 것 같습니다. 1. 내 로컬 파일을 Colab에 업로드하기 dkfl8151.tistory.com/4?category=831673 Colab환경에서 데이터 분석 진행하기! (데이터 불러오기) chrome.google.com/webstore/detail/open-in-colab/iogfkhleblhcpcekbiedikdehleodpjo Open in Colab Open a Github-hosted notebook in Google Colab chrome.google.c..
입력 값으로, 리스트를 받고 Target에 해당하는 index값을 출력으로 반환하는 문제이다. 이진검색이란? 정렬된 배열에서 타겟을 찾는 검색 알고리즘이다. 시간복잡도가 O(logn)이라는 점에서 대표적인 로그 시간 알고리즘이다 . 위의 문제를 4가지 방법으로 풀 수 있다. 1.재귀 풀이 절반씩 범위를 줄여나가며 맞출 때까지 계속 재귀 호출을 하면된다. def search(self, num:List[int], target: int) -> int: def binary_search(left, right): # mid는 두 포인트의 중간지점 if left target: return binary_search(left, mid-1) else: return mid # -1은 맨 끝 index를 의미 else: re..
범주형 변수를 컴퓨터가 인식할 수 있게 해주기 위해서는 따로 encoding 과정을 거쳐야 한다. 범주형 변수란? - 연속형 변수가 아닌 것을 의미한다. 연속하지 않기 때문에 그래프로 표현하게 되면 아래 그래프와 같이 뚝뚝 끊기게 나타난다. ex ) grade , state , job 대표적으로는 One - Hot Encoding Ordinal - Encoding Label Encoding Target Encoding Binary Encoding 등 다용한 종류가 존재한다. 단어 집합의 크기를 벡터의 차원으로 하고, 표현하고 싶은 단어의 인덱스에 1의 값을 부여하며 다른 인덱스에는 0을 부여하는 단어의 벡터 표현 방식이다. (고유 값의 개수만큼 컬럼을 만든다는 특징이 있다. ) pd.get_dummies..
ERE
'파이썬' 태그의 글 목록