see package를 이용한 시각화 modern 테마와 flat design colours를 이용한 더 보기 좋은 산점도 blackboard 테마를 이용한 바이올린 플랏과 material design colours Abyss 테마 easystats라는 프로젝트에서 만든 시각화 보조 패키지 easystats is a suite of R packages designed to make the use of advanced statistical techniques easy. library(see) library(ggplot2) modern 테마와 flat design colours를 이용한 더 보기 좋은 산점도 data(iris) ggplot(iris, aes(x=Sepal.Width, y=Sepal.Lengt..
GermanCredit data EDA Modeling with caret Make imbalance dataset Split dataset trainControl setup Logistic Regression Random Forest Support Vector Machine Evaluation ROC curve library(caret) # GermanCredit library(tidyverse) library(ggthemes) library(ggmosaic) library(gridExtra) 모델링에 사용할 데이터는 GermanCredit이다. caret 패키지의 내장 데이터이고, 패키지에 있는 데이터 설명을 보면 아래와 같다. Description Data from Dr.Hans Hofmann of..
Functions Functions in MLmetrics Package User defined functions for gini and ks Examples Plotting library(tidyverse) library(ggthemes) Functions in MLmetrics Package #### ROC-AUC #### ROCAUC
Optimization with inequality constraints Primal problem Dual problem Support Vector Machine(SVM) Optimal Separating Hyperplane Maximal Margin Classifier - linearly separable case Soft Margin Classifier(linear SVM) - linearly nonseparable case R code Data setting Quadratic Programming for SVM Reference 이 글은 고려대학교 통계학과 신승준 교수님의 2018년 1학기 통계 계산 방법론(대학원) 강의를 바탕으로 작성되었습니다. 참고할 만한 링크들 고려대학교 강필성, 김성범 교..
목차 What is the OOB(Out of Bag) observations? OOB(Out of Bag)는 Bagging(Bootstrap Aggregation)에서 등장하는 용어이다. 배깅에서 핵심은 bootstrap 표본을 만들어 트리를 반복 적합하는 것이다. 각각의 배깅된 트리는 평균적으로 관측치들의 2/3를 사용한다. 배깅된 트리를 적합하는데 사용되지 않은 나머지 1/3의 관측치들을 OOB(Out of Bag) 관측치라고 한다. 이것은 bootstrap 표본을 만들 때 복원추출을 하기 때문에 나타나는 현상이다. 이러한 성질 때문에 배깅이나 랜덤포레스트에서는 OOB 관측치를 test set처럼 사용할 수 있다. Why OOB observations are around one-third of or..
kaggle 대회에서 요즘 가장 인기있는 알고리즘은 lightgbm인 것 같습니다. 학습속도도 빠르고(개인저인 경험에 의하면 xgboost 보다 빠릅니다) 성능도 좋기 때문이죠. kaggle 대회에서는 kernel을 사용하면 별도의 설치과정 없이 lightgbm 패키지를 이용할 수 있지만 다른 공모전이나 분석을 하려면 결국 로컬에 설치해야합니다. 기본 설치법은 lightgbm 깃허브를 참고하면 됩니다. https://github.com/Microsoft/LightGBM/tree/master/R-package microsoft/LightGBM A fast, distributed, high performance gradient boosting (GBDT, GBRT, GBM or MART) framework ..
아나콘다 설치 후 명령창에서 conda install -c r r-essentials R에서 library(devtools) install_github('IRkernel/IRkernel') IRkernel::installspec()
install.packages('installr') library(installr) updateR() 여기까지 하고 나면 기존에 R을 설치할 때 나왔던 설치파일 화면이 나옵니다. 원하는 옵션을 선택해서 설치하고 나면 이전 버전의 패키지들은 카피할 것인지 물어보는 단계가 진행됩니다. 이전에 설치된 R버전은 직접 제거해 줘야 합니다.