데이터분석

    PM과 데이터

    IT기업에서는 어마무시한 데이터의 홍수속에서 허덕일 수 밖에 없는 상황들이 펼쳐진다. 이 때, 적절한 의미있는 정리를 만들어 내는게 중요하다. 그래서 가장 중요하게 꼽히는 인력이 바로 '데이터 인력'이다. 데이터 직무 데이터를 다루는 직무는 크게 3가지로 나눠진다. 1. 데이터 분석가 : 해당 서비스의 도메인에 대한 이해를 바탕으로 비즈니스를 위한 통계를 추출한다. 2. 데이터 엔지니어 : 분산처리 시스템에 대한 이해를 바탕으로 데이터 인프라를 구축한다. 3. 데이터 사이언티스트 : 머신 러닝 모델 구축을 바탕으로 통계 분석 및 애널리틱 리포팅을 진행한다. * 머신러닝? 컴퓨터에게 데이터 학습을 시켜 개선하는 훈련 데이터 분석가와 타 직무의 가장 큰 차이라 함은 데이터 분석가는 '데이터 그 자체보다는 비..

    [패스트캠퍼스] 장인을 위한 파이썬 데이터 분석 초격차 패키지 Online - Part1

    [ 엑셀과의 차이점 ] - 대용량, 복잡한 데이터 처리 가능 - 고차원 분석 실현 가능 [ 분석환경 ] Colab - 데이터 분석 환경 적합한 툴 Anaconda - 개발 환경에 적합한 툴 [ Colab 알아보기 ] - 코드 스니펫 : 자주 사용하는 코드를 정의해두는 기능 - 변수검사 : 변수 사용 후 정합성 확인할 때 활용 [ 셀의 종류 ] - 코드 셀 : 코드 실행을 위한 표현, 주석 표현은 #을 기입 후 적기 - 텍스트 셀 : 실제 실행이 아닌 설명 - 셀 종류 변경하기 Ctrl + M : 수정한다는 의미 코드 셀로 변경 (Ctrl + M => Y) 텍스트 셀로 변경 (Ctrl + M => M) [ 실행 ] - 순서대로 실행됨 - 실행 : CTRL + ENTER - 실행 후 커서 내림 : SHIFT..

    [R] 데이터 분석 실습 : 단어구름 패키지 + 실습 오류 정리

    다양한 패키지 중 간지나는거 찾았다! 단어구름 패키지(WORDCLOUD) - 단어+빈도수를 구름으로 만드는 data.frame 자세한 만드는 방법은 이분 블로그를 참조하였다. https://zzinnam.tistory.com/entry/R-%EA%B7%B8%EB%9E%98%ED%94%BD%EC%8A%A4-%EC%9B%8C%EB%93%9C-%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9CWord-Cloud-%EC%83%9D%EC%84%B1%ED%95%98%EA%B8%B0#google_vignette 내용을 덧붙일 부분만 정리를 해보았다. - color

    [R] 통계 프로그램 R studio 사용하기 (2)

    내가 하면 이상하게 자꾸 아래의 오류가 떠서 모~든 cvs파일을 불러올 때 하는 일이 있다. Error in make.names(col.names, unique = TRUE) : invalid multibyte string at '' 1. setwd("저장할위치 /로 구분하여 차례대로 서술") 2. read.cvs("읽을 cvs파일.cvs') 3. Sys.getlocale() Sys.setlocale("LC_ALL","C") 4. read.cvs("읽을 cvs파일.cvs') 5. Sys.setlocale("LC_ALL", "Korean") 6. 붙일 변수 = read.cvs("읽을 cvs파일.cvs') 아이고 복잡하다 1. 컬럼들(백터)확인하기 - editor창에 names(붙인변수) 입력 후 run e..