전체 글 165

2일차 복습: 데이터전처리 과정(summarise함수, group_by함수)

일단 group_by 함수부터 접근하면 데이터 프레임이 있다는 가정하에 같은 열 값을 가진 행을 기준으로 그룹화 시킨다는 의미 (가로로 긴 데이터 나온다는 의미/ 행 데이터) 이런 데이터프레임이 있다면 group_by(class)를 돌리면 class를 각 그룹별로 1반 2반 3반순으로 정렬하는 작업 그 후 summarise 함수를 이용하여 각 반으로 나눠진 그룹의 합 sum / 최댓값 max / 최소값 min / 평균 mean / 표준편차 sd / mediam 중앙값 / n() 빈도 등 함수 결합을 통해 요약 데이터 추출 가능 n() 는 빈도수를 나타내는데, 1차적으로 그룹함수를 통해 특정 열이 일치하는 행들의 갯수를 파악하는 의미 여러 제조사 중에서 컴팩트타입 차량의 생산량을 파악하는데 닛싼에서 2대 ..

2일차 복습: 데이터전처리 과정(arrange함수, mutate함수)

arrange(데이터) 함수 오름차순 정렬 arrange(desc(데이터)) 함수 내림차순 정렬 반 내림차순 5>1 정렬 하면서 math는 오름차순이니깐 낮은 점수부터 정렬 즉, 반별로 1차 구분 한다음에 그 안에서 수학점수가 낮은사람부터 정렬 연습문제 141쪽 audi 차중 hwy를 높은순으로 5대의 데이터 추출 getwd() setwd("C:/Rdata") install.packages("ggplot2") install.packages("dplyr") library(ggplot2) library(dplyr) mpg mpg %>% filter(manufacturer=="audi") %>% arrange(desc(hwy)) %>% head(5) 제조사로 아우디로 먼저 뽑아 낸 후, hwy 정렬 한 후에 ..

2일차복습 : 데이터전처리 과정(filter함수, select함수)

데이터 전처리 : data preprocessing 데이터를 사용 하기전 입맛에 맞게 데이터를 가공하는 작업. 대학원에서 전처리 전처리 해서 뭔말 있가 했는데.. 영어보니 알겠네... 번역을 해도 전처리 하.... 전처리 과정에서는 주료 6가지 함수 사용 filter - 행 추출 select - 열 추축 arrange - 정렬 mutate - 가공하여 행 추가(변수 추가) summarise - 요약 group_by - 분류별 구분 // summarise 함수와 group_by는 거의 같이 사용함. 1. filter 함수 -> 행만 추출 -> 콘솔창에서 보면 데이터가 행만 도출됨 (가로로 쭉~) filter 함수 (등호 사용 가능) 함수 병렬연결 시 , 와 &는 같음 (and) or 은 shift+\ 버튼..

2일차 복습 - 1일차 복습 리뷰

1회차 복습 알스튜디오 도움말 입력 가능 3가지 f1 , help(), 함수에 커서 csv는 무엇의 약자인가 comma separated value 함수 사용전 해야 할 일 install.packages(”패키지”) / 따옴표 속에 패키지명 // s library(패키지) / 따옴표 없이 패키지명 read_excel(”c:/…) 읽기 (워킹디렉토리) 데이터프레임(df)이 3행 3열일 경우 df[ ,1] / 각 행의 1열 12345 결과값 나오는 함수? print ( 1:5) c(1:5) 패키지 설치 하는 방법 및 확인 우측 하단을 통해 패키지 설치 가능 패키지 - 인스톨 - 패키지 검색 후 인스톨 체크가 되어있으면 설치완료 체크가 안되어 있으면 미설치상태

1일차 복습: R패키지

R은 외부 데이터를 많이 이용하기에 패키지 설치가 필수 인것 같다. #R패키지설치 install.padkage("패키지명") / 패키지설치하기 installed.package() / 설치된 패키지 확인 #워킹디렉토리설정 패키지를 설치 후 파일을 불러오거나 저장할때 해당 파일의 작업공간을 지정 해줘야하므로.. getwd("/작업공간)으로 지정 필요... ** 그런데 이건 프로젝트마다 폴더가 달라지는데... 헷갈릴것 같은 느낌... #엑셀패키지설치 엑셀의 경우는 패키지 readxl 이 필요하고 패키지 설치 후에는 ribrary 를 이용하여 읽어줘야 사용가능 그 후 읽기 함수 read_excel("파일명") 통해 불러오면 콘솔창에 엑셀이 슈우우우웅 들어옴 #CSV불러오기 CSV는 패키지가 필요 없나?? CSV..

1일차 복습: R의 대한 개념 설치 방법

R수업은 대략 5일 예상 파이썬과 R의 차이점은 파이썬은 개발에 더 적합 R은 데이터 분석에 더 적합 R과 R스튜디오 설치 필요 R 다운로드 https://cran.yu.ac.kr/ The Comprehensive R Archive Network cran.yu.ac.kr R스튜디오 다운로드 https://posit.co/download/rstudio-desktop/ Posit The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises. posit.co 전 세계 R 커뮤니티 https://cran.r-project.org..

국비지원 코딩 도전기#4. 중앙정보처리학원 3차 면접과 합격

https://shuoshi.tistory.com/222 국비지원 코딩 도전기#3. 중앙정보처리학원 상담 https://shuoshi.tistory.com/221 국비지원 코딩 도전기 #2. 코딩 학원 알아보기 코딩 코딩... 초딩도 코딩을 한다는데... 아니 생각해 보니... 작년 크리스마스 때, 4살도 안 되는 조카에게... 선물로 콩순이 shuoshi.tistory.com 앞선 포스팅에서는 중앙정보처리학원의 1차, 2차 면접에 대한 작성 하였습니다. 아마 이때가 11월 말경이었는데, 그 당시 담당 팀장님께서 말씀해 주시길 1월 말이나 2월 말에 3차 면접이 진행될 예정이니 따로 안내문자 발송 예정입니다.. 그렇데 12월이 지나고.. 1월 말이 다돼 가도록... 면접 관련 문자가 안 와서 다시 연락드..

국비지원 코딩 도전기#3. 중앙정보처리학원 상담

https://shuoshi.tistory.com/221 국비지원 코딩 도전기 #2. 코딩 학원 알아보기 코딩 코딩... 초딩도 코딩을 한다는데... 아니 생각해 보니... 작년 크리스마스 때, 4살도 안 되는 조카에게... 선물로 콩순이코딩 컴퓨터를 사줬었다.. (현재 잘 가지고 노는중...) 앞서 작성했던 1 shuoshi.tistory.com 국비지원 코딩 도전기 2편을 통해 중앙정보처리학원 딱 한곳에 상담 접수를 했고... 바로 상담일정을 잡았습니다. 전화를 통해 먼저 상담 요청한 게 맞는지 확인하고 상담이 맞다 하면 워크넷에서 직업심리검사를 하고 오라는 사전과제?도 있었습니다 1시간 가량 테스트를 했던걸로 기억하는데... 구직자들이라면 인적성 검사는 한두번 해봤을테니.. 그런류의 테스트 (개인적..

국비지원 코딩 도전기 #2. 코딩 학원 알아보기

코딩 코딩... 초딩도 코딩을 한다는데... 아니 생각해 보니... 작년 크리스마스 때, 4살도 안 되는 조카에게... 선물로 콩순이코딩 컴퓨터를 사줬었다.. (현재 잘 가지고 노는중...) 앞서 작성했던 1편에서도 잠시 언급했었지만... https://shuoshi.tistory.com/220 국비지원 코딩 도전기 #1. 사표부터 던지기 솔직히 파이썬이라는 것을 들어본 건 몇 년 되지 않았다 라떼만해도... 코딩이 아니라 프로그래밍 파이썬이 아니라 C언어.. HTML 이런 거였으니 아무튼 현재 중견기업 사무직으로 재직하며 한 달 shuoshi.tistory.com 내가 하는 직무에서 코딩이 있다면 추가적인 새로운 분야로 진출할 수 있다 생각했기에... 아무튼 친한 직장동료도 코딩학원을 알아봐서 추천해 ..