Chapter 5 3. k-fold 교차검증에 대해 살펴본다. (a) k-fold 교차검증을 어떻게 구현하는지 설명하여라. 1) 데이터를 랜덤하게 크기가 거의 같은 k개은 그룹(fold)로 나눈다. 2) 첫 번째 fold는 test set으로 취급하고 적합은 나머지 k-1개 fold에 대해 수행한다. 3) 첫 번째 MSE 추정치를 계산한다. 4) 이것을 k개의 집단에 대해 반복한다. 모두 k번의 계산이 이루어지는 것이다. 5) k개의 MSE 의 평균을 k-fold CV 추정치로 사용한다. (b) 아래 두 기법에 대한 k-fold 교차검증의 장점과 단점은 무엇인가? i. validation set 기법 장점: validation set 기법보다 test MSE 추정치의 variablility가 훨씬 작다...
이 글은 Introduction to Statistical Learning with R (ISLR)의 내용을 바탕으로 작성되었습니다. 저자들은 웹사이트를 통해 pdf 파일과 예제데이터, 예제코드를 제공하고 있습니다. http://www-bcf.usc.edu/~gareth/ISL/ Resampling은 ISLR 5장의 내용입니다. 5장에서는 4가지 resampling 기법을 설명하고 있습니다. 1. Validation Set Approach 2. Leave One Out Cross-Validation 3. k-fold Cross-Validation 4. Bootstrap 1. Validation Set Approach Validation Set Approach는 데이터를 train과 test로 분할하는 가..
이 글은 Introduction to Statistical Learning with R (ISLR)의 내용을 바탕으로 작성되었습니다. 저자들은 웹사이트를 통해 pdf 파일과 예제데이터, 예제코드를 제공하고 있습니다. http://www-bcf.usc.edu/~gareth/ISL/ Linear Model Selection and Regularization (1)에서는 크기가 다른 모델들 중에서 가장 좋은 모델을 고르기 위해 test MSE를 간접적으로 추정하는 방법들에 대해 알아봤습니다. 이번에는 Validation Set 기법과 k-fold Cross-Validation 기법을 이용해서 직접적으로 test MSE를 계산하는 방법에 대해 알아보겠습니다. 먼저 Validation Set 기법을 사용하기 위해..