Chpater | Title (클릭하면 페이지로 이동) | 비고 |
---|---|---|
1. R Code 기본 1단계 | R 기본 문법 1편 | - 진짜 기본 문법 |
R 기본 문법 2편 | - 변수 형태에 대한 소개 | |
R 기본 문법 3편 | - 논리문 및 자동문 | |
R 데이터 불러오기 | - 데이터 불러오기-데이터 소개 | |
R 시각화 1편 | ggplot2 - 막대도표 |
|
R 시각화 2편 | ggplot2 - 히스토그램 - 밀도함수 - 상자그림 - 산점도 |
|
R 데이터 핸들링 기본 | ifelse, subset, ddply - 조건에 따라 값 코딩하기 - 조건에 따라 데이터 추출 - 데이터 집계 |
|
통계값 뽑아내기 | - 간단한 평균, 편차 등 | |
2. R Code 기본 2단계 | 결측치 처리 방법 | - 결측치 삭제 - 결측치 대체 |
이상치 처리 방법 | - 이상치 탐색 - 이상치 제거 |
|
문자열 데이터 처리 1편 | - 문자열 추출 - 문자열 붙이기 - 문자열 분리 - 문자열 대체 - 텍스트마이닝(Corpus 활용) - 텍스트 시각화 |
|
문자열 데이터 처리 2편 | - 간단한 응용 방법 | |
3. R Flexdashboard | Flexdashboard 시작하기 전 | - markdown 소개 - typora 소개 |
Flexdashboard를 통해 Dashboard 만들기 1편 | - 출력 옵션 설정 - layout 설정 |
|
Flexdashboard를 통해 Dashboard 만들기 1편_레이아웃 예시 | - 레이아웃 예시 | |
Flexdashboard를 통해 Dashboard 만들기 2편 | - plotly 활용 -render을 통한 동적 그래프 만들기 |
|
4. R Code 중급 | 고수들이 자주 쓰는 R코드 소개 1편 | -같은 기능을 하는 R 코드 비교 -dplyr %>% 이해하기 |
고수들이 자주 쓰는 R코드 소개 2편 | -중복데이터 제거 방법 |
|
고수들이 자주 쓰는 R코드 소개 3편 | -Reshape 활용하기 -데이터 구조 변환 |
|
고수들이 자주 쓰는 R코드 소개 4편 | -데이터 합병하기 | |
TEST | TEST 1 | R을 활용한 데이터 핸들링 및 시각화 |
TEST 2 | 영화감독 평가지표 만들어보기 |
Ch2. 중복데이터 제거하기 및 데이터 프레임 정렬 Ch2. 중복데이터 제거하기 및 데이터 프레임 정렬 흔하지는 않지만, 중복으로 입력되는 데이터 셋을 마주치는 일이 생기기 마련입니다. 보통 중복데이터는 데이터 수집단계에서 많이 발생합니다. 하지만 이를 하나하나 엑셀로 처리하는 것은 한계가 있기때문에, R에서 처리하는 방법에 대해 다루어 보고자 합니다. 1차원 벡터, 리스트에서의 중복 제거 A = rep(1:10, each = 2) # 1 ~ 10까지 2번씩 반복 print(A) ## [1] 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 # 중복 제거 unique(A) ## [1] 1 2 3 4 5 6 7 8 9 10 데이터 프레임에서의 중복 제거 다음과 같은 데이터 프레임을 예시로 삼겠습니다. 변수 설명 OBS : 번호 NAME : 환자 이름 ID : 환자 고유번호 DATE : 검사 날짜 BTW : Body total water 먼저, 환자 이름이 있고, 그 환자의 고유 ID가 있습니다. 세상에 동명이인은 많기 때문에 항상 고유 ID를 기록해둡니다. # 데이터 불러오기 DUPLICATE = read.csv("C:/R/DUPLICATED.csv") DUPLICATE ## OBS NAME ID DATE BTW ## 1 1 A A10153 2018-11-30 1 ## 2 2 A A10153 2018-11-30 3 ## 3 3 B B15432 2018-11-30 4 ## 4 4 A A15853 2018-11-29 5 ## 5 5 C C54652 2018-11-28 5 ## 6 6 C C54652 2018-11-27 6 ## 7 7 D D14