[ 엑셀과의 차이점 ]
- 대용량, 복잡한 데이터 처리 가능
- 고차원 분석 실현 가능
[ 분석환경 ]
Colab
- 데이터 분석 환경 적합한 툴
Anaconda
- 개발 환경에 적합한 툴
[ Colab 알아보기 ]
- 코드 스니펫 <> : 자주 사용하는 코드를 정의해두는 기능
- 변수검사 : 변수 사용 후 정합성 확인할 때 활용
[ 셀의 종류 ]
- 코드 셀 : 코드 실행을 위한 표현, 주석 표현은 #을 기입 후 적기
- 텍스트 셀 : 실제 실행이 아닌 설명
- 셀 종류 변경하기
- Ctrl + M : 수정한다는 의미
- 코드 셀로 변경 (Ctrl + M => Y)
- 텍스트 셀로 변경 (Ctrl + M => M)
[ 실행 ]
- 순서대로 실행됨
- 실행 : CTRL + ENTER
- 실행 후 커서 내림 : SHIFT + ENTER
- 셀 추가 : ALT + ENTER
[ 분석 환경 스펙 정보 확인 ]
- 우분투 = 리눅스 운영 체제
- 메모리 사양 = RAM 사양
[ 마크다운 - 기본 기능 ]
- HTML태그 입력 없이, 가장 일반적인 서식을 표현할 수 있도록 구성되어 있음
1. 헤더 : #으로 표현되는 글자들 (#개수에 따라 글씨 크기도 달라짐)
- 최대 6개 사용 가능
2. 수평선 : 구역 나누는 데에 사용
- -,*를 사용하고 3개이상 써야 수평선으로 치환됨
3. 줄바꿈 : <br> 입력이 필수
4. 강조하기
- 기울여 쓰기: * 또는 _ 로 감싼 텍스트
- 두껍게 쓰기 : ** 또는 __ 로 감싼 텍스트
- 취소선 : ~~ 로 감싼 텍스트
5. 인용구 : >를 사용하여 최대 3개 수주까지 가능
6. 리스트 목록 만들기 : 기본적으로 tab(들여쓰기)를 하고 기입
- 순서가 없는 리스트 : -, +, * 를 이용
- 순서가 있는 리스트 : (숫자). 형식을 이용
7. 특수 문자 기입 표현하기
- \를 앞에 붙이고 원하는 특수 문자 기입
[ 마크다운 - 추가 기능 ]
- [링크이름](링크 url)
- 이미지/동영상 삽입 : html 문법을 사용하여 기입
- %%html로 시작
- src = 소스를 의미함
- 웹 페이지 삽입 : html 위치를 삽입
[데이터 분석을 위한 준비]
- 정형 데이터 세트 : 이해가 쉬운 형태
- 대표적인 라이브러리 'PANDAS' (CSV를 열어보고 조작도 가능함)
- 텍스트 파일 (TXT, 엑셀 CSV)
- DB 파일
- 비정형 데이터 세트 : 행과 열 개념 없는 형태
- 대표적인 라이브러리 'OpenCV' (그래픽 처리 및 머신러닝도 가능함)
- 이미지 파일
- 멀티미디어 파일
- 바이너리 파일
- 반정형 데이터 세트 : 비정형 + 정형인 형태
- JSON 파일 (KEY-VALUE) - 웹에서 데이터 교환시 사용
- { "구분" : { "운동":[{"종목":"농구"}]}}
- XML 파일 (TAG를 통해 설명) - HTML보다 자유로운 태그 가능
- <구분><운동><종목><농구></종목></운동>
'관련 도서 및 지식 > 강의 및 인사이트' 카테고리의 다른 글
[패스트캠퍼스] 장인을 위한 파이썬 데이터 분석 초격차 패키지 Online - Part2 : 기호, 구문, 자료형 (0) | 2023.02.20 |
---|---|
PM과 데이터 (0) | 2023.02.17 |
[협업툴] 구글 시트로 업무 즐기기 (2) | 2023.02.16 |
[정보보안과 연계정보] CI에 대하여 (0) | 2023.02.03 |
[ JAVASCRIPT ] 그랩 - 비전공자 부트캠프 강의 : JAVASCRPIT (2) (0) | 2023.01.19 |