psystat
close
프로필 배경
프로필 로고

psystat

  • 아카이브 (170)
    • 위스키 (16)
    • 해외여행 (17)
      • 보라카이 (6)
      • 후쿠오카 (2)
      • 삿포로 (3)
      • 가고시마 (6)
    • 데이터분석 (112)
      • Quant (29)
      • XAI (3)
      • ISLR (4)
      • 통계 체크리스트 (1)
      • Credit Scoring (2)
      • Python (25)
      • R (4)
      • SQL (36)
      • Kaggle & Dacon (2)
      • Linux (1)
    • 이것저것 (20)
    • Tistory (4)
  • 홈
  • ABOUT
[R] see package를 이용한 시각화

[R] see package를 이용한 시각화

see package를 이용한 시각화 modern 테마와 flat design colours를 이용한 더 보기 좋은 산점도 blackboard 테마를 이용한 바이올린 플랏과 material design colours Abyss 테마 easystats라는 프로젝트에서 만든 시각화 보조 패키지 easystats is a suite of R packages designed to make the use of advanced statistical techniques easy. library(see) library(ggplot2) modern 테마와 flat design colours를 이용한 더 보기 좋은 산점도 data(iris) ggplot(iris, aes(x=Sepal.Width, y=Sepal.Lengt..

  • format_list_bulleted 데이터분석/R
  • · 2019. 10. 1.
  • textsms
[R] R을 이용한 신용평가모형 개발

[R] R을 이용한 신용평가모형 개발

GermanCredit data EDA Modeling with caret Make imbalance dataset Split dataset trainControl setup Logistic Regression Random Forest Support Vector Machine Evaluation ROC curve library(caret) # GermanCredit library(tidyverse) library(ggthemes) library(ggmosaic) library(gridExtra) 모델링에 사용할 데이터는 GermanCredit이다. caret 패키지의 내장 데이터이고, 패키지에 있는 데이터 설명을 보면 아래와 같다. Description Data from Dr.Hans Hofmann of..

  • format_list_bulleted 데이터분석/Credit Scoring
  • · 2019. 9. 23.
  • textsms
[R] 신용평가 모형 평가지표

[R] 신용평가 모형 평가지표

Functions Functions in MLmetrics Package User defined functions for gini and ks Examples Plotting library(tidyverse) library(ggthemes) Functions in MLmetrics Package #### ROC-AUC #### ROCAUC

  • format_list_bulleted 데이터분석/Credit Scoring
  • · 2019. 9. 16.
  • textsms
Support Vector Machine(SVM)

Support Vector Machine(SVM)

Optimization with inequality constraints Primal problem Dual problem Support Vector Machine(SVM) Optimal Separating Hyperplane Maximal Margin Classifier - linearly separable case Soft Margin Classifier(linear SVM) - linearly nonseparable case R code Data setting Quadratic Programming for SVM Reference 이 글은 고려대학교 통계학과 신승준 교수님의 2018년 1학기 통계 계산 방법론(대학원) 강의를 바탕으로 작성되었습니다. 참고할 만한 링크들 고려대학교 강필성, 김성범 교..

  • format_list_bulleted 데이터분석
  • · 2019. 6. 18.
  • textsms
OOB 관측개체가 전체 관측개체의 약 1/3인 이유

OOB 관측개체가 전체 관측개체의 약 1/3인 이유

목차 What is the OOB(Out of Bag) observations? OOB(Out of Bag)는 Bagging(Bootstrap Aggregation)에서 등장하는 용어이다. 배깅에서 핵심은 bootstrap 표본을 만들어 트리를 반복 적합하는 것이다. 각각의 배깅된 트리는 평균적으로 관측치들의 2/3를 사용한다. 배깅된 트리를 적합하는데 사용되지 않은 나머지 1/3의 관측치들을 OOB(Out of Bag) 관측치라고 한다. 이것은 bootstrap 표본을 만들 때 복원추출을 하기 때문에 나타나는 현상이다. 이러한 성질 때문에 배깅이나 랜덤포레스트에서는 OOB 관측치를 test set처럼 사용할 수 있다. Why OOB observations are around one-third of or..

  • format_list_bulleted 데이터분석
  • · 2019. 6. 17.
  • textsms
R에서 lightgbm 설치하기

R에서 lightgbm 설치하기

kaggle 대회에서 요즘 가장 인기있는 알고리즘은 lightgbm인 것 같습니다. 학습속도도 빠르고(개인저인 경험에 의하면 xgboost 보다 빠릅니다) 성능도 좋기 때문이죠. kaggle 대회에서는 kernel을 사용하면 별도의 설치과정 없이 lightgbm 패키지를 이용할 수 있지만 다른 공모전이나 분석을 하려면 결국 로컬에 설치해야합니다. 기본 설치법은 lightgbm 깃허브를 참고하면 됩니다. https://github.com/Microsoft/LightGBM/tree/master/R-package microsoft/LightGBM A fast, distributed, high performance gradient boosting (GBDT, GBRT, GBM or MART) framework ..

  • format_list_bulleted 데이터분석/R
  • · 2019. 6. 3.
  • textsms

jupyter notebook과 R 연동

아나콘다 설치 후 명령창에서 conda install -c r r-essentials R에서 library(devtools) install_github('IRkernel/IRkernel') IRkernel::installspec()

  • format_list_bulleted 데이터분석/R
  • · 2016. 12. 25.
  • textsms
[ISLR] Linear Model Selection and Regularization (1) (Best subset selection, Forward Selection, Backward Elimination)

[ISLR] Linear Model Selection and Regularization (1) (Best subset selection, Forward Selection, Backward Elimination)

이 글은 Introduction to Statistical Learning with R (ISLR)의 내용을 바탕으로 작성되었습니다. 저자들은 웹사이트를 통해 pdf 파일과 예제데이터, 예제코드를 제공하고 있습니다. http://www-bcf.usc.edu/~gareth/ISL/ Linear Model Selection and Regularization은 교재 6장의 내용입니다. 여기서는 Hitters라는 데이터셋을 이용하고 있습니다. library(ISLR) Hitters names(Hitters) > names(Hitters) [1] "AtBat" "Hits" "HmRun" "Runs" "RBI" "Walks" "Years" [8] "CAtBat" "CHits" "CHmRun" "CRuns" "CRB..

  • format_list_bulleted 데이터분석/ISLR
  • · 2016. 12. 5.
  • textsms
R버전 업데이트 하기

R버전 업데이트 하기

install.packages('installr') library(installr) updateR() 여기까지 하고 나면 기존에 R을 설치할 때 나왔던 설치파일 화면이 나옵니다. 원하는 옵션을 선택해서 설치하고 나면 이전 버전의 패키지들은 카피할 것인지 물어보는 단계가 진행됩니다. 이전에 설치된 R버전은 직접 제거해 줘야 합니다.

  • format_list_bulleted 데이터분석/R
  • · 2016. 9. 11.
  • textsms
  • navigate_before
  • 1
  • navigate_next
공지사항
전체 카테고리
  • 아카이브 (170)
    • 위스키 (16)
    • 해외여행 (17)
      • 보라카이 (6)
      • 후쿠오카 (2)
      • 삿포로 (3)
      • 가고시마 (6)
    • 데이터분석 (112)
      • Quant (29)
      • XAI (3)
      • ISLR (4)
      • 통계 체크리스트 (1)
      • Credit Scoring (2)
      • Python (25)
      • R (4)
      • SQL (36)
      • Kaggle & Dacon (2)
      • Linux (1)
    • 이것저것 (20)
    • Tistory (4)
최근 글
인기 글
최근 댓글
태그
  • #위스키
  • #글또
  • #MariaDB
  • #sql
  • #python
  • #R
  • #mysql
  • #streamlit
  • #SQLD
  • #마리아DB
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바