
- R의 기본 자료 구조
-> 벡터는 c(),seq(),rep(), : 등을 이용해 생성
- c( ) 원소들을 묶어 벡터 생성
> x <- c(1,3,5,7,9)
콜론 연산자 n:m을 이용하여 원소가 n, n+1, ... , m인 벡터 생성
> y <- 3:-1
[1] 3 2 1 0 -1
-seq( ) 함수를 이용하여 수열 형태의 벡터 생성
> z <- seq(from=1, to = 9, by=2)
[1] 1 3 5 7 9
- rep() 함수를 이용하여 값이 반복되는 형태의 벡터 생성
> w <- rep(z, times=2, each= 3)
[1] 1 1 1 3 3 3 5 5 5 7 7 7 9 9 9 1 1 1 3 3 3 5 5 5 7 7 7 9 9 9
- 괄호 [ ] 를 이용하여 벡터 내의 일부 원소만 선택 가능
> x <- c(0,1,1,2,3,5,8,13)
> x[c(2,4,6,8)]. #두번째 네번째 여섯번째 8번째
[1] 1 2 5 13
- 해당되는 원소를 제외한 나머지 원소 선택
> x[-c(1,3,5,7)]
[1] 1 2 5 13
- 벡터의 원소들은 논리형 데이터 벡터를 이용하여 선택 가능
> x[c(T,T,T,T,F,F,F,F)]
[1] 0 1 1 2
- R벡터 연산의 특징 : 원소단위 연산
> x <- c(1,2,3)
> y <- c(1,2,3)
> x + y
[1] 2 4 6
> x - y
[1] 0 0 0
> x * y
[1] 1 4 9
> x / y
[1] 1 1 1
> x > 1
[1] FALSE TRUE TRUE
- 조건문을 이용하여 특정한 조건을 만족키시는 벡터의 원소 추출 가능
> x <- c(1,2,3)
> y <- c(1,2,4)
> x[x==y]
[1] 1 2
> x[x<y]
[1] 3
- which( ) : 논리값이 TRUE에 해당되는 원소의 인덱스 반환
> x <- c(0.3, 0.1, 0.4, 0.5, 0.2, 0.6)
> which( x >= 0.5)
[1] 4 6
- recycling : 길이가 서로 다른 벡터들에 대해 연산자를 적용할 때 길이가 짧은 벡터를 반복해서 사용
> x <- c(1,2,3,4,5,6,7)
> y <- c(1,2)
> x - y
[1] 0 0 2 2 4 4 6
> x + 1
[1] 2 3 4 5 6 7 8
- NA는 결측치, NULL은 값이 존재하지 않음을 의미
> x <- c(1,2,3,NA)
> mean(x)
[1] NA
> mean( x, na.rm = T)
[1] 2
'기타' 카테고리의 다른 글
[R] 문자열 데이터 다루기 (추출,붙이기,대체,분리) (0) | 2022.10.08 |
---|---|
[R] 메트릭스 (Matrices) (0) | 2022.10.08 |
[R]Commands, Data Type (0) | 2022.10.08 |
기술통계-산포도,사분위범위,변동계수,분산,표준편차 (0) | 2022.09.26 |
기술통계값-중심경향값 (0) | 2022.09.26 |