통계학을 공부하면서 가장 햇갈리는 부분이 많았던 개념이 바로 가설검정이다. 일단, 가설검정의 논리를 이해하는 것도 어려웠고,(최근에 가설검정의 논리를 잘 설명해놓은 글을 발견했다. http://www.dongascience.com/news/view/14553) 영가설을 기각하지 못했을 때 영가설을 accept 한다고 말할 수 있는지는 항상 나를 괴롭혀왔던 문제였다. 어떤 교수님은 영가설을 기각하지 못했을 때 영가설을 accept 한다는 것은 정확하지 않은 표현이고 영가설을 sustain한다고 하는 것이 올바른 표현이라고 하셨다. ...(1) 하지만 또 다른 교수님은 영가설을 기각하지 못했을 때 영가설을 accept한다고 해도 관계없다고 말씀하셨다. ...(2) 도대체 뭐가 맞는 것일까 궁금했었는데 수리통..
객관식 - ERD 분석 문제 => 두 개 정도 나왔던 걸로 기억- 트랜잭션의 4가지 속성(고립성이 격리성으로 지속성이 영속성으로 출제)- 설계속성, 파생속성 등 속성의 유형에 대한 설명- 슈퍼/서브타입- 다음 중 관계에 대한 설명으로 옳지 않은 것은?- 객체무결성, 도메인무결성, 참조무결성, 정규화 중 SQL에서 제공하는 제약조건이 아닌 것은?- 테이블 분할을 하는 반정규화를 해야 하는 상황이 아닌 거은?- PRIMARY KEY가 설정되어 있는 칼럼에 중복된 결과 값이 있을 수 있다는 선택지 찾는 게 있었음- INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN, CROSS JOIN 으로 생기는 결과행 수 모두 더하는 문제- NULL이 포함된 테..
install.packages('installr') library(installr) updateR() 여기까지 하고 나면 기존에 R을 설치할 때 나왔던 설치파일 화면이 나옵니다. 원하는 옵션을 선택해서 설치하고 나면 이전 버전의 패키지들은 카피할 것인지 물어보는 단계가 진행됩니다. 이전에 설치된 R버전은 직접 제거해 줘야 합니다.
다음 중 Hash Join의 특징을 가장 적절하게 표현한 것을 2개 고르시오. ① Driving Table의 검색범위가 성능에 가장 큰 영향을 주는 조인 방식이다. ② 내부적으로 Function을 사용한다. ③ 조인 조건의 인덱스 유무에 영향을 받지 않지만 Sort가 필요하다. ④ 크기 차이가 나는 두 집합의 조인 시에 유리하며, Sort가 일어나지 않는다. [출처] http://www.dbguide.net/da.db?cmd=snb9_4_view&boardUid=168442&boardConfigUid=81 정답 : ②, ④ ① Driving Table의 데이터 양이 가장 큰 영향을 주는 조인 방식이다.(NLJ) NLJ는 조인 테이블의 순서에 따라 일의 양이 변하므로 가장 드라이빙 테이블의 영향을 많이 받..
다음 SQL 문장 중 COLUMN1의 값이 널(NULL)이 아닌 경우를 찾아내는 문장으로 가장 적절한 것은? (ANSI 표준 기준) ① SELECT * FROM MYTABLE WHERE COLUMN1 IS NOT NULL ② SELECT * FROM MYTABLE WHERE COLUMN1 NULL ③ SELECT * FROM MYTABLE WHERE COLUMN1 != NULL ④ SELECT * FROM MYTABLE WHERE COLUMN1 NOT NULL [출처] http://www.dbguide.net/da.db?cmd=snb9_4_view&boardUid=168331&boardConfigUid=81 * 정답 및 해설 * 정답 : ① NULL 값을 조건절에서 사용하는 경우 IS NULL, IS N..
다음 중 실행계획에 대한 설명으로 가장 부적절한 것은? ① 실행계획은 SQL 처리를 위한 실행 절차와 방법을 표현한 것이다. ② 실행계획은 조인 방법, 조인 순서, 액세스 기법 등이 표현된다. ③ 동일 SQL문에 대해 실행계획이 다르면 실행 결과도 달라질 수 있다. ④ CBO(Cost Based Optimizer)의 실행계획에는 단계별 예상 비용 및 건수 등이 표시된다. [출처] http://www.dbguide.net/da.db?cmd=snb13_view&boardGroupUid=6&boardConfigUid=81&boardUid=168101 * 정답 및 해설 * 정답 : ③ 실행계획 즉, 실행방법이 달라진다고 해서 결과가 달라지지는 않는다.
다음 중 SQL과 옵티마이저에 대한 설명으로 가장 부적절한 것을 2개 고르시오. ① 두 SQL 결과가 같다면, 수행속도도 별 차이가 없다. ② 옵티마이저에 의해 내부적인 쿼리 변환이 이루어지더라도 결과집합에는 영향을 주지 않는다. ③ 사용자가 제시하는 SQL은 결과에 대한 요구사항일 뿐이며 처리절차는 옵티마이저가 결정한다. ④ 사용자가 부여한 조건은 실행계획에 영향을 주지 않는다. [출처] http://www.dbguide.net/da.db?cmd=snb9_4_view&boardUid=166991&boardConfigUid=81 * 정답 및 해설 * 정답 : ①, ④ 두 SQL의 결과가 같더라도 SQL 형태에 따라 수행속도가 크게 다를 수 있다. 실행계획에 가장 큰 영향을 미치는 것은 조건절이다.
다음 중 SELECT절에 사용하는 서브쿼리인 스칼라 서브쿼리(Scalar Subquery)에 대한 설명으로 가장 적절한 것을 2개 고르시오. ① 내부적으로 Unique 작업을 실행한다. ② 하나의 로우에 해당하는 결과 건수는 1건 이하여야 한다. ③ Min 또는 Max 함수를 사용해야 한다. ④ 결과 칼럼의 개수는 1개여야 한다. [출처] http://www.dbguide.net/da.db?cmd=snb9_4_view&boardUid=166434&boardConfigUid=81 * 정답 및 해설 * 정답 : ②, ④ 스칼라 서브쿼리의 결과는 1칼럼의 1건이다. 한 행, 한 칼럼(1 Row 1 Column)만을 반환하는 서브쿼리 단일 행 서브쿼리이기 때문에 결과가 2건 이상 반환되면 SQL문은 오류를 반환
다음 중 논리 데이터 모델을 물리 데이터 모델로 변환할 때 슈퍼타입/서브타입 데이터 모델에 대한 변환방법으로 가장 부적절한 것은? ① 공통화된 슈퍼타입에 대해 데이터가 너무 많거나 칼럼이 너무 많은 경우 수직분할과 수평분할을 적용하여 성능을 향상 시키도록 한다. ② 슈퍼타입, 서브타입 각각에 대해 테이블이 독립적으로 구분되어 1:1관계의 테이블이 유지될 수 있도록 한다. ③ 슈퍼타입과 서브타입을 결합하여 한 개의 테이블로 생성하여 서브타입의 개수만큼 테이블을 생성한다. ④ 전체 테이블을 하나의 테이블에 속성을 모두 포함하도록 한다. 다만 서브타입일 경우 속성마다 Not Null을 지정할 수 있지만 통합되면 개별적인 특징을 반영하지 못할 수 있다. [출처] http://www.dbguide.net/da.d..
다음 중 서브쿼리에 대한 설명으로 가장 부적절한 것은? ① 메인 쿼리는 조직 테이블(1)이고, 서브쿼리는 사원 테이블(M)을 사용할 경우, 질의 결과는 M레벨인 사원 레벨로 나온다. ② 메인쿼리에서 서브쿼리 칼럼을 사용할 수 없다. ③ 서브쿼리에서 메인쿼리 칼럼은 사용할 수 있다. ④ 서브쿼리의 연결 연산자로서 ‘=’을 사용할 경우, 서브쿼리 파트의 결과는 1건 이하여야 한다. [출처] http://www.dbguide.net/da.db?cmd=snb9_4_view&boardUid=166044&boardConfigUid=81 * 정답 및 해설 * 정답 : ① 서브쿼리를 사용한 경우, 질의 결과는 항상 메인쿼리 레벨과 동일하다.