백엔드 프레임워크 & 언어/R 15

천단위 쉼표 숫자처리

bb = as.numeric("1,234") Warning message: NAs introduced by coercion > class(bb) [1] "numeric" as.numeric은 따옴표를 뗀 후 숫자만 남아야 한다. 따라서 gsb를 통해 문자열 대체, 정규표현식을 통한 문자열 처리를 해주고 처리하여야 한다. as.numeric(gsub(pattern = ",", replacement = "","1,234")) as.numeric(gsub(pattern = "[^0-9]", replacement = "", "1,234")) 그런데, 다만 정규표현식 replace를 통해 대체하여 숫자외 문자열을 제외하였으나 다음과 같이 소수점이 포함된 경우는 as.numeric(gsub(pattern = "[^..

R분석 답안제출시 rownames 제외 주의

head(Orange) write.csv(Orange, "write_csv_rownames_FALSE.csv", row.names = FALSE) write.csv(Orange, "write_csv_rownames_TRUE.csv") list.files(pattern = "rownames") #실기 답안 제출시에는 rowsnames를 제외하고 하여야 함. df_f = read.csv("write_csv_rownames_FALSE.csv") head(df_f) df_t = read.csv("write_csv_rownames_TRUE.csv") head(df_t) # 데이터 테이블을 사용하는 경우 library("data.table") fwrite(Orange, "write_csv_fwrite.csv") d..

dplyr 패키지-group_by, summarise 함수

# arrange(), mutate() 함수 # 1.dplyr 패키지 설치 install.packages("dplyr") # 2.libary load library(dplyr) # 3. csv로 부터 데이터 로딩 exam % arrange(math) exam %>% arrange(desc(math)) # 6.기준을 두개이상 두고 싶다!! # 반별로 먼저 정렬 후에 수학점수 내림차순으로 정렬 exam %>% arrange(class, desc(math)) # 7. 학생 별 평균 점수 데이터 추가 exam %>% mutate(avg = (math + english + science)/3) # mean 함수는 vector 데이터를 연산하고 싶을 때 사용 # 8. exam 데이터에 적용 exam % mutate..

반응형