Ch1. R 기본 문법 소개 3편
- as와 is
- as는 변수 x를 ~~로 취급하겠다. 라는 의미를 가집니다.
- is는 논리문으로써 변수 x가 ~인지 판단하여라. 라는 의미를 가집니다.
- rep(), seq()
- rep()는 repeat의 줄임말로 반복된 데이터를 생성할 때 쓰입니다.
- seq()는 sequence의 줄임말로 순차적인 데이터를 생성할 때 쓰입니다.
- 패키지 설치하기
- R은 프로그램이 가벼운 대신, 필요한 함수는 패키지를 설치하여 사용해야 됩니다.
- 패키지를 설치한 후에는, 패키지를 R에 부착시켜야 합니다.
- 자동문, 조건문
- 데이터를 분석하다보면, 반복작업을 진행해야되거나, case by case별로 데이터를 정리해야 될 때가 있습니다. 이런 경우, 하나씩 입력하는 것보다는 for문과 if문을 사용하는 것이 훨씬 일이 효율적입니다.
- { } 안에는 함수를 써서, 명령어를 완성해줍니다.
x=c(1,2,3,4,5,6,7,8,9,10)
x1 = as.integer(x)
x2 = as.numeric(x)
x3 = as.factor(x)
x4 = as.character(x)
str(x1)
## int [1:10] 1 2 3 4 5 6 7 8 9 10
summary(x1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 3.25 5.50 5.50 7.75 10.00
str(x2)
## num [1:10] 1 2 3 4 5 6 7 8 9 10
summary(x2)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 3.25 5.50 5.50 7.75 10.00
str(x3)
## Factor w/ 10 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10
summary(x4)
## Length Class Mode
## 10 character character
str(x4)
## chr [1:10] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10"
x=c(1,2,3,4,5,6,7,8,9,10)
y=c("str",'str2',"str3","str4")
is.integer(x)
## [1] FALSE
is.numeric(x)
## [1] TRUE
is.factor(y)
## [1] FALSE
is.character(y)
## [1] TRUE
x1 = c(1:10) # 1 ~ 10 까지 1씩 증가하는 수열 생성
x2 = seq(1,10,2) # 1 ~ 10까지 2씩 증가하는 수열 생성
x1
## [1] 1 2 3 4 5 6 7 8 9 10
x2
## [1] 1 3 5 7 9
y = rep(1,10) # 1을 10번 반복
# install.packages("ggplot2") # ggplot2라는 패키지 설치
library(ggplot2) # ggplot2 패키지 부착
## Need help getting started? Try the cookbook for R:
## http://www.cookbook-r.com/Graphs/
for(i in 1:5){ # i에 1 ~ 5까지의 정수를 차례대로 부여
print(i) # i를 출력
}
## [1] 1
## [1] 2
## [1] 3
## [1] 4
## [1] 5
LIST = seq(1,30,2) # LIST에 1 ~ 30 까지 2씩 증가하는 정수들의 벡터 생성.
SPACE = c() # SPACE라는 변수가 없는 벡터 생성.
for( i in LIST){ #i에 LIST에 속한 값들을 차례대로 부여
SPACE = c(SPACE,i) #SPACE에 i를 저장.
}
SPACE
## [1] 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
A = c(1,2,3,4,5)
if( 7 %in% A){
print("TRUE")
} else{
print("FALSE")
}
## [1] "FALSE"
여기까지 R에서 쓰이는 기본적인 문법들은 다루었습니다. 다음 장에서부터는 데이터를 직접 가져와서 R을 활용해보도록 하겠습니다.