백엔드 프레임워크 & 언어/R

dplyr 패키지-mutate() 함수 심화

anodos 2022. 2. 26. 22:28

# arrange(), mutate() 함수 
# 1.dplyr 패키지 설치
install.packages("dplyr")

# 2.libary load
library(dplyr)

# 3. csv로 부터 데이터 로딩
exam <- read.csv("csv_exam.csv")

# 4. 데이터 확인
exam

# 5.수학점수 순으로 정렬 (ctl + shif +m)
# 기본 오름 차순
exam %>%  arrange(math)
exam %>%  arrange(desc(math))

# 6.기준을 두개이상 두고 싶다!!
# 반별로 먼저 정렬 후에 수학점수 내림차순으로 정렬
exam %>% arrange(class, desc(math))

# 7. 학생 별 평균 점수 데이터 추가
exam %>% mutate(avg = (math + english + science)/3)
# mean 함수는 vector 데이터를 연산하고 싶을 때 사용

# 8. exam 데이터에 적용
exam <- exam %>% mutate(avg = (math + english + science)/3)

# 9. 평균접수가 60이상이면 pass, 아니면 fail 
# 대입연산자 단축키 alt + '-'
exam %>%  mutate(pass = ifelse(avg >= 60,"pass","fail"))
exam <- exam %>%  mutate(pass = ifelse(avg >= 60,"pass","fail"))

# 10. pass, fail 각 데이터열의 빈도수
table(exam$pass)

# 11.평균 점수가 90점 이상이면 A, 70 ~ 89이면 B, 그외에는 C 부여
exam <- exam %>% mutate(grade = ifelse(avg >=90,"A",ifelse(avg >=70, "B","C")))

# 12. grade 빈도수 
table(exam$grade)
                

반응형