[TEST 1] R을 활용한 데이터 핸들링 및 시각화

R 데이터 시각화 2편

# 코드 실행전에 처리되어 있어야 하는 데이터 전처리 
DATA = read.csv('C:/R/HR_comma_sep.csv')
DATA$left = as.factor(DATA$left)
DATA$Work_accident = as.factor(DATA$Work_accident)
DATA$promotion_last_5years = as.factor(DATA$promotion_last_5years)

time_spend_average	Work_period
1~2년차	New
3~5년차	Middle
6년차 ~	Expert

average_monthly_hours	Working_Time
1분위수 미만	Very Free
1분위수 ~ 중위수	Free
중위수 ~ 3분위수	Busy
3분위수 ~	Very Busy

추출 데이터 이름	Working_Hard
Work_period	3~5년차
Working_Time	'Busy' or 'Very Busy'

재미라도 꿈꾸자

재미라도 꿈꾸자

[TEST 1] R을 활용한 데이터 핸들링 및 시각화

Ch4. TEST_1 데이터 핸들링 및 시각화

1. [데이터 핸들링] time_spend_company변수를 활용하여, 다음에 해당되는 Work_period 변수를 만들어보시길 바랍니다. (ifelse 사용)

2. [데이터 핸들링] average_monthly_hours변수를 활용하여, 다음에 해당되는 Working_Time 변수를 만들어보시길 바랍니다. (ifelse 사용)

3. [데이터 추출] 1번, 2번 문제에서 만든 Work_period, Working_Time 변수를 활용하여, 다음 조건에 해당하는 데이터 셋을 추출해 주세요. (subset 활용)

4. [데이터 생성] 다음의 데이서 셋을 만들어 보세요. (ddply 이용)

5. [시각화] 다음의 그래프를 그려보세요.(ggplot2 이용)

6. 부서(sales) 중에 월평균 근무시간이 가장 높은 부서와, 직무 만족도가 가장 낮은 부서는 어느 부서인가요?

태그

이 블로그의 인기 게시물

6.1.2 고수들이 자주 쓰는 R코드 소개 2편 [중복 데이터 제거 방법]

3. Resampling 방법론(Leave one out , Cross Validation)

4.4.1 R 문자열(TEXT) 데이터 처리하기 1

4. 통계적 추정(점추정,구간추정)

3.2.3 R 시각화[ggplot2] 2편 (히스토그램, 밀도글래프, 박스플롯, 산점도)