코딩하는 ditto/R 10

R 개념정리 5장 - 데이터분석(str(), table함수, ifelse함수)

https://shuoshi.tistory.com/234 4장을 통해서 data.frame을 만드는 과정을 했다면 5장에서는 그 data가 무엇인지 파악하는 작업 1. 데이터프레임 분석 함수 일단 데이터를 분석하는 가장 기본적인 함수 head() / 앞에서 6행 출력 tail() / 뒤에서 6행 출력 dim() / data.frame의 크기 (차원) 출력 str() / 데이터의 속상(성분) 출력 (x행이 뭔지 y열이 뭔지 등등) summary() / 행을 기준으로해서 열을 분석 요약함 (평균, 등) 2. table 함수 table 함수 / 빈도 파악 table(exam$math) 3. ifelse 함수 ifelse 함수 mathre80,"P","F") mathre ifelse 중첩 결합 exam ifel..

R 개념정리 4장 - 데이터프레임

4장의 핵점 내용은 데이터프레임 1.데이터 프레임 생성 데이터 프레임을 만드는 2가지 방법 첫 번째, 변수를 만든 후 합쳐서 표 만들기 두 번째, 처음부터 표를 만들면서 그 속에 변수 넣기 물론, 이 두 가지 외에도 데이터 불러오기라던지 등등 방법은 많으니 가장 기본적인 거만.. 2. 파일 불러오기 / 내보내기(저장하기) https://shuoshi.tistory.com/233 3장에서 언급한 것처럼 파일 불러오거나 내 보낼 때는 별도 패키지가 필요하기도 함, 주로 사용하는 게 엑셀과 CSV파일이니.. 파일 불러오기 / 저장하기 (readxl / writexl 패키지 필요) 파일 불러오기 (엑셀) : read_excel(”파일명. xlsx”) sheet가 여러 개 일 때는 sheet 넘버 입력 : rea..

R 개념정리 3장 - 변수의 이해(paste함수, 패키지함수)

쉽게 배우는 R데이터분석 책 기준 복습 3장의 결론: 변수의 이해 1. paste 함수 이해하기 paste() - 문자를 이어서 출력해 주는 함수 paste(), paste0()과 차이를 두고 한 시간 가까이 검색해 가면서 개념을 파악하려 했으나 결론은 큰 차이 없음. paste()와 paste0()은 sep 부분이 있냐 없냐 차이인데, collapse()라는 항목으로 sep가 거의 대체 가능하다 시피해서 문자를 공백 없이 쭉 출력하고 싶으면 paste0() 사용하고 문자 사이 뭘 넣고 싶으면 paste() 사용하는걸로 혼자 정리 끝. 2. 패키지 설치와 패키지로 사용 가능한 함수 library(dplyr) - 전처리 과정시 자주 사용 library(ggplot2) - 그래프 ggplot, qplot, ..

2일차 복습: 데이터전처리 과정(summarise함수, group_by함수)

일단 group_by 함수부터 접근하면 데이터 프레임이 있다는 가정하에 같은 열 값을 가진 행을 기준으로 그룹화 시킨다는 의미 (가로로 긴 데이터 나온다는 의미/ 행 데이터) 이런 데이터프레임이 있다면 group_by(class)를 돌리면 class를 각 그룹별로 1반 2반 3반순으로 정렬하는 작업 그 후 summarise 함수를 이용하여 각 반으로 나눠진 그룹의 합 sum / 최댓값 max / 최소값 min / 평균 mean / 표준편차 sd / mediam 중앙값 / n() 빈도 등 함수 결합을 통해 요약 데이터 추출 가능 n() 는 빈도수를 나타내는데, 1차적으로 그룹함수를 통해 특정 열이 일치하는 행들의 갯수를 파악하는 의미 여러 제조사 중에서 컴팩트타입 차량의 생산량을 파악하는데 닛싼에서 2대 ..

2일차 복습: 데이터전처리 과정(arrange함수, mutate함수)

arrange(데이터) 함수 오름차순 정렬 arrange(desc(데이터)) 함수 내림차순 정렬 반 내림차순 5>1 정렬 하면서 math는 오름차순이니깐 낮은 점수부터 정렬 즉, 반별로 1차 구분 한다음에 그 안에서 수학점수가 낮은사람부터 정렬 연습문제 141쪽 audi 차중 hwy를 높은순으로 5대의 데이터 추출 getwd() setwd("C:/Rdata") install.packages("ggplot2") install.packages("dplyr") library(ggplot2) library(dplyr) mpg mpg %>% filter(manufacturer=="audi") %>% arrange(desc(hwy)) %>% head(5) 제조사로 아우디로 먼저 뽑아 낸 후, hwy 정렬 한 후에 ..

2일차복습 : 데이터전처리 과정(filter함수, select함수)

데이터 전처리 : data preprocessing 데이터를 사용 하기전 입맛에 맞게 데이터를 가공하는 작업. 대학원에서 전처리 전처리 해서 뭔말 있가 했는데.. 영어보니 알겠네... 번역을 해도 전처리 하.... 전처리 과정에서는 주료 6가지 함수 사용 filter - 행 추출 select - 열 추축 arrange - 정렬 mutate - 가공하여 행 추가(변수 추가) summarise - 요약 group_by - 분류별 구분 // summarise 함수와 group_by는 거의 같이 사용함. 1. filter 함수 -> 행만 추출 -> 콘솔창에서 보면 데이터가 행만 도출됨 (가로로 쭉~) filter 함수 (등호 사용 가능) 함수 병렬연결 시 , 와 &는 같음 (and) or 은 shift+\ 버튼..

2일차 복습 - 1일차 복습 리뷰

1회차 복습 알스튜디오 도움말 입력 가능 3가지 f1 , help(), 함수에 커서 csv는 무엇의 약자인가 comma separated value 함수 사용전 해야 할 일 install.packages(”패키지”) / 따옴표 속에 패키지명 // s library(패키지) / 따옴표 없이 패키지명 read_excel(”c:/…) 읽기 (워킹디렉토리) 데이터프레임(df)이 3행 3열일 경우 df[ ,1] / 각 행의 1열 12345 결과값 나오는 함수? print ( 1:5) c(1:5) 패키지 설치 하는 방법 및 확인 우측 하단을 통해 패키지 설치 가능 패키지 - 인스톨 - 패키지 검색 후 인스톨 체크가 되어있으면 설치완료 체크가 안되어 있으면 미설치상태

1일차 복습: R패키지

R은 외부 데이터를 많이 이용하기에 패키지 설치가 필수 인것 같다. #R패키지설치 install.padkage("패키지명") / 패키지설치하기 installed.package() / 설치된 패키지 확인 #워킹디렉토리설정 패키지를 설치 후 파일을 불러오거나 저장할때 해당 파일의 작업공간을 지정 해줘야하므로.. getwd("/작업공간)으로 지정 필요... ** 그런데 이건 프로젝트마다 폴더가 달라지는데... 헷갈릴것 같은 느낌... #엑셀패키지설치 엑셀의 경우는 패키지 readxl 이 필요하고 패키지 설치 후에는 ribrary 를 이용하여 읽어줘야 사용가능 그 후 읽기 함수 read_excel("파일명") 통해 불러오면 콘솔창에 엑셀이 슈우우우웅 들어옴 #CSV불러오기 CSV는 패키지가 필요 없나?? CSV..

1일차 복습: R의 대한 개념 설치 방법

R수업은 대략 5일 예상 파이썬과 R의 차이점은 파이썬은 개발에 더 적합 R은 데이터 분석에 더 적합 R과 R스튜디오 설치 필요 R 다운로드 https://cran.yu.ac.kr/ The Comprehensive R Archive Network cran.yu.ac.kr R스튜디오 다운로드 https://posit.co/download/rstudio-desktop/ Posit The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises. posit.co 전 세계 R 커뮤니티 https://cran.r-project.org..