psystat
close
프로필 배경
프로필 로고

psystat

  • 아카이브 (171)
    • 위스키 (16)
    • 해외여행 (17)
      • 보라카이 (6)
      • 후쿠오카 (2)
      • 삿포로 (3)
      • 가고시마 (6)
    • 데이터분석 (112)
      • Quant (29)
      • XAI (3)
      • ISLR (4)
      • 통계 체크리스트 (1)
      • Credit Scoring (2)
      • Python (25)
      • R (4)
      • SQL (36)
      • Kaggle & Dacon (2)
      • Linux (1)
    • 이것저것 (21)
    • Tistory (4)
  • 홈
  • ABOUT
python 원핫인코딩은 사이킷런의 OneHotEncoder를 사용하자

python 원핫인코딩은 사이킷런의 OneHotEncoder를 사용하자

pandas.get_dummies 대신 sklearn.preprocessing.OneHotEncoder를 쓰자¶ 1. pandas.get_dummies의 문제점¶ pandas.get_dummies는 train 데이터의 특성을 학습하지 않기 때문에 train 데이터에만 있고 test 데이터에는 없는 카테고리를 test 데이터에서 원핫인코딩 된 칼럼으로 바꿔주지 않는다. In [4]: import pandas as pd train = pd.DataFrame({'num1':[1,2,3,4,5], 'num2':[10,20,30,40,50], 'cat1':['a', 'a', 'b', 'c', 'c']..

  • format_list_bulleted 데이터분석/Python
  • · 2021. 8. 14.
  • textsms
  • navigate_before
  • 1
  • navigate_next
공지사항
전체 카테고리
  • 아카이브 (171)
    • 위스키 (16)
    • 해외여행 (17)
      • 보라카이 (6)
      • 후쿠오카 (2)
      • 삿포로 (3)
      • 가고시마 (6)
    • 데이터분석 (112)
      • Quant (29)
      • XAI (3)
      • ISLR (4)
      • 통계 체크리스트 (1)
      • Credit Scoring (2)
      • Python (25)
      • R (4)
      • SQL (36)
      • Kaggle & Dacon (2)
      • Linux (1)
    • 이것저것 (21)
    • Tistory (4)
최근 글
인기 글
최근 댓글
태그
  • #글또
  • #python
  • #streamlit
  • #마리아DB
  • #mysql
  • #위스키
  • #sql
  • #R
  • #MariaDB
  • #SQLD
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바