본문 바로가기

분류 전체보기261

빅분기 실기준비 #3 [py] T1-3. 결측치 처리(map 활용) Expected Questions. https://www.kaggle.com/code/bulgam/py-t1-3-map-expected-questions 여기서 공부중... 결측치 처리는 평소에도 활용이 중요할 듯.. 우선 탐색적 분석을 통해서 결측값 확인 df.isnull().sum() 결측치가 많은 컬럼삭제할 때는 df.drop활용 반드시 axis = 1 넣어줄 것 ! (axis = 0 행기준, axis = 1 열기준) # f3 컬럼 삭제 print("삭제 전:", df.shape) df = df.drop(['f3'], axis=1) map 함수 활용해서 결측치 대체하는 방법 - df.fillna 결측치 대체 - map 함수 활용해서 매칭 # f1결측치 .. 2022. 10. 18.
빅분기 실기준비 #2 [py] T1-2. 이상치를 찾아라(소수점 나이) Expected Questions https://www.kaggle.com/code/bulgam/py-t1-2-expected-questions 여기서 공부하는중... 소수점 확인할 때 중요한건 ! - 올림/내림/버림 활용 올림 : np.ceil() 내림 : np.floor() 버림 : np.trunc() *중요 내림과 버림의 차이 ? - 양수에서는 같음 - 음수에서는 다름 !! ex) -5.5에서 내림을 하면 - 6, 버림을 하면 -5 # 이상치를 포함한 데이터 올림, 내림, 버림의 평균값 # 올림 m_ceil = np.ceil(df['age']).mean() # 내림 m_floor = np.floor(df['age']).mean() # 버림 m_tru.. 2022. 10. 18.
빅분기 실기준비 #1 [py] T1-1. 이상치를 찾아라(IQR활용) Expected Questions https://www.kaggle.com/code/bulgam/py-t1-1-iqr-expected-questions 간단한 탐색적 데이터 분석(EDA) 1. df.shape 2. df.isnull().sum() 활용할 것 * IQR 구하기 np.percentile 활용 2022. 10. 18.