# arrange(), mutate() 함수
# 1.dplyr 패키지 설치
install.packages("dplyr")
# 2.libary load
library(dplyr)
# 3. csv로 부터 데이터 로딩
exam <- read.csv("csv_exam.csv")
# 4. 데이터 확인
exam
# 5.수학점수 순으로 정렬 (ctl + shif +m)
# 기본 오름 차순
exam %>% arrange(math)
exam %>% arrange(desc(math))
# 6.기준을 두개이상 두고 싶다!!
# 반별로 먼저 정렬 후에 수학점수 내림차순으로 정렬
exam %>% arrange(class, desc(math))
# 7. 학생 별 평균 점수 데이터 추가
exam %>% mutate(avg = (math + english + science)/3)
# mean 함수는 vector 데이터를 연산하고 싶을 때 사용
# 8. exam 데이터에 적용
exam <- exam %>% mutate(avg = (math + english + science)/3)
# 9. 평균접수가 60이상이면 pass, 아니면 fail
# 대입연산자 단축키 alt + '-'
exam %>% mutate(pass = ifelse(avg >= 60,"pass","fail"))
exam <- exam %>% mutate(pass = ifelse(avg >= 60,"pass","fail"))
# 10. pass, fail 각 데이터열의 빈도수
table(exam$pass)
# 11.평균 점수가 90점 이상이면 A, 70 ~ 89이면 B, 그외에는 C 부여
exam <- exam %>% mutate(grade = ifelse(avg >=90,"A",ifelse(avg >=70, "B","C")))
# 12. grade 빈도수
table(exam$grade)
'백엔드 프레임워크 & 언어 > R' 카테고리의 다른 글
dplyr패키지-left_join(), bind_rows() 함수 (0) | 2022.02.26 |
---|---|
dplyr 패키지-group_by, summarise 함수 (0) | 2022.02.26 |
dplyr 패키지-arrange(), mutate() 함수(정렬 및 파생변수 생성) (0) | 2022.02.26 |
dplyr패키지-select() (원하는 열만 추출) (0) | 2022.02.26 |
dplyr패키지-Filter(원하는 행만 추출) (0) | 2022.02.26 |