2024학년도 2학기 데이터분석입문
- 수업에서 작성한 2번째 노트북 파일 완성(교재 p22까지)해서 자신의 깃허브 저장소에 업로드
- 중간고사 범위
- 1주 ~ 7주 수업한 내용
- 교재의 내용과 코드 중심
- 문제 형식은 작년 중간고사 참고
- 기말고사 범위
- 전체 수업 범위
-
파이썬 언어를 활용하고 공공데이터 또는 토이데이터(toy data)인 pydataset을 사용해 데이터분석
- 서울 날씨 데이터, 우리나라 읍면동 인구 데이터 분석을 참고해서 1시간 수업 분량의 데이터분석
- 교재 8장 참고(패키지 pydataset과 다양한 데이터 파일 활용)
-
제출 파일
- [2024.11.19(화)까지] 과제계획서 제출, 반대표는 파일을 취합해서 교수에게 메일([email protected])로 전송
- [2024.11.03(화)까지] 과제결과보고서 제출, 파일 3개(과제계획서, 과제결과보고서와 팀과제 파일(01조_*.ipynb)) 저장소 주소 업로드
- A반
- B반
-
팀과제 발표일
- 2024.12.04(수), 수업 중에 업로드 결과 파일인 ipynb 파일로 발표
- 국내의 공공데이터 사이트는 다양한 분야의 데이터를 제공하여 연구, 정책 수립, 비즈니스 등 여러 용도로 활용될 수 있습니다. 아래는 주요 공공데이터 사이트 목록입니다.
-
한국 공공데이터 포털 data.go.kr
- 한국 정부가 제공하는 공공데이터를 통합적으로 제공하는 플랫폼으로, 다양한 분야의 데이터셋을 검색하고 다운로드할 수 있습니다.
-
통계청 kostat.go.kr
- 국가 통계에 대한 정보를 제공하며, 인구, 경제, 사회 등 다양한 통계 데이터를 제공합니다.
-
KOSIS (한국통계정보시스템) kosis.kr
- 통계청에서 제공하는 통계 데이터의 통합 플랫폼으로, 다양한 통계 자료를 검색하고 활용할 수 있습니다.
-
서울 열린 데이터 광장 data.seoul.go.kr
- 서울시에서 제공하는 공공데이터로, 서울시의 다양한 정보와 데이터를 제공합니다.
-
AI HUB aihub.or.kr
- 인공지능 관련 데이터셋을 제공하는 플랫폼으로, AI 연구 및 개발에 필요한 데이터를 찾을 수 있습니다.
-
지역 데이터 포털 localdata.go.kr
- 지역별 공공데이터를 제공하여 지역 발전 및 정책 수립에 활용할 수 있는 데이터를 제공합니다.
-
건강보험심사평가원 opendata.hira.or.kr
- 건강보험 관련 데이터를 제공하며, 의료 및 건강 관련 연구에 유용합니다.
-
빅데이터 플랫폼 bigdata.seoul.go.kr
- 서울시의 빅데이터를 활용한 다양한 서비스와 데이터를 제공합니다.
- 기준 폴더 [데이터분석A-w09-14] 또는 [데이터분석B-w09-14]에서 git bash를 실행해 다음 수행
git clone https://github.com/ai7dnn/2024-intro-DA.git
- vscode에서 복제된 폴더 하부의 youtube-contents를 선택해 실행
- 각 주피터노트북 파일 *.ipynb를 열어 select kernel에서 아나콘다의 (base)를 선택 후 실행
- [09주] .../youtube-contents/lecture13-14-15-age-bar-pie.ipynb
- [10주] .../youtube-contents/lecture16-17-18-age-gender-scatter.ipynb
- 걍 교수의 AIT code
- 다음은 참고 유튜브 강좌로 본 수업의 내용과 다른 내용도 있습니다.