코딩하는 ditto/R

2일차 복습: 데이터전처리 과정(arrange함수, mutate함수)

디또크 2023. 3. 3. 02:09
728x90

arrange(데이터) 함수 오름차순 정렬

 

arrange(desc(데이터)) 함수 내림차순 정렬 <- 주로 내림차순 정렬 많이 사용

 

arrange(desc(class),math) 기준으로

desc(class) -> 반 내림차순 5>1 정렬 하면서 math는 오름차순이니깐 낮은 점수부터 정렬

즉, 반별로 1차 구분 한다음에 그 안에서 수학점수가 낮은사람부터 정렬

 

연습문제 141쪽

audi 차중 hwy를 높은순으로 5대의 데이터 추출

 

getwd()
setwd("C:/Rdata")
install.packages("ggplot2")
install.packages("dplyr")

library(ggplot2)
library(dplyr)

mpg

mpg %>% filter(manufacturer=="audi") %>%
  arrange(desc(hwy)) %>%
  head(5)

 

 

제조사로 아우디로 먼저 뽑아 낸 후, hwy 정렬 한 후에 5개 추출.

 


mutate 함수

앞선 데이터를 가공하여 데이터프레임에 새로운 열 추가시 사용

 

mutate 함수를 이용하여

total과 avg 데이터 생성하여 콘솔 가장 우측에 삽입

 

여기서 ifelse 함수 추가로 사용 가능 (엑셀이 약한데...ㅠ)

이거 된줄 알았는데 지금 콘솔 천천히보니 틀렸네...ㅠ

 

exam<-read.csv("csv_exam.csv")
exam

exam %>% 
  mutate(test=ifelse(science>=60,"pass","fail"))

 

재도전해서 성공...

 

//

 

arrange 함수는 desc 만 잘쓰면 문제 없을듯하고

mutate 함수에서 ifelse는 조금더 연습이 필요할듯

책보고는 되는데.. 잘안됨.

 

// 추가로 

함수와는 전혀 관계 없는

패키지 설치, 파일 불러오기, 라이브러리 형성.. 이런부분이.. 막히는 증상 발견.

728x90