R함수 4

R 개념정리 5장 - 데이터분석(str(), table함수, ifelse함수)

https://shuoshi.tistory.com/234 4장을 통해서 data.frame을 만드는 과정을 했다면 5장에서는 그 data가 무엇인지 파악하는 작업 1. 데이터프레임 분석 함수 일단 데이터를 분석하는 가장 기본적인 함수 head() / 앞에서 6행 출력 tail() / 뒤에서 6행 출력 dim() / data.frame의 크기 (차원) 출력 str() / 데이터의 속상(성분) 출력 (x행이 뭔지 y열이 뭔지 등등) summary() / 행을 기준으로해서 열을 분석 요약함 (평균, 등) 2. table 함수 table 함수 / 빈도 파악 table(exam$math) 3. ifelse 함수 ifelse 함수 mathre80,"P","F") mathre ifelse 중첩 결합 exam ifel..

R 개념정리 4장 - 데이터프레임

4장의 핵점 내용은 데이터프레임 1.데이터 프레임 생성 데이터 프레임을 만드는 2가지 방법 첫 번째, 변수를 만든 후 합쳐서 표 만들기 두 번째, 처음부터 표를 만들면서 그 속에 변수 넣기 물론, 이 두 가지 외에도 데이터 불러오기라던지 등등 방법은 많으니 가장 기본적인 거만.. 2. 파일 불러오기 / 내보내기(저장하기) https://shuoshi.tistory.com/233 3장에서 언급한 것처럼 파일 불러오거나 내 보낼 때는 별도 패키지가 필요하기도 함, 주로 사용하는 게 엑셀과 CSV파일이니.. 파일 불러오기 / 저장하기 (readxl / writexl 패키지 필요) 파일 불러오기 (엑셀) : read_excel(”파일명. xlsx”) sheet가 여러 개 일 때는 sheet 넘버 입력 : rea..

2일차 복습: 데이터전처리 과정(arrange함수, mutate함수)

arrange(데이터) 함수 오름차순 정렬 arrange(desc(데이터)) 함수 내림차순 정렬 반 내림차순 5>1 정렬 하면서 math는 오름차순이니깐 낮은 점수부터 정렬 즉, 반별로 1차 구분 한다음에 그 안에서 수학점수가 낮은사람부터 정렬 연습문제 141쪽 audi 차중 hwy를 높은순으로 5대의 데이터 추출 getwd() setwd("C:/Rdata") install.packages("ggplot2") install.packages("dplyr") library(ggplot2) library(dplyr) mpg mpg %>% filter(manufacturer=="audi") %>% arrange(desc(hwy)) %>% head(5) 제조사로 아우디로 먼저 뽑아 낸 후, hwy 정렬 한 후에 ..

2일차복습 : 데이터전처리 과정(filter함수, select함수)

데이터 전처리 : data preprocessing 데이터를 사용 하기전 입맛에 맞게 데이터를 가공하는 작업. 대학원에서 전처리 전처리 해서 뭔말 있가 했는데.. 영어보니 알겠네... 번역을 해도 전처리 하.... 전처리 과정에서는 주료 6가지 함수 사용 filter - 행 추출 select - 열 추축 arrange - 정렬 mutate - 가공하여 행 추가(변수 추가) summarise - 요약 group_by - 분류별 구분 // summarise 함수와 group_by는 거의 같이 사용함. 1. filter 함수 -> 행만 추출 -> 콘솔창에서 보면 데이터가 행만 도출됨 (가로로 쭉~) filter 함수 (등호 사용 가능) 함수 병렬연결 시 , 와 &는 같음 (and) or 은 shift+\ 버튼..