Skip to content

ai7dnn/2024-intro-DA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

73 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

2024-intro-DA

2024학년도 2학기 데이터분석입문

01주 과제

  • 수업에서 작성한 2번째 노트북 파일 완성(교재 p22까지)해서 자신의 깃허브 저장소에 업로드

중간고사와 기말고사

  • 중간고사 범위
    • 1주 ~ 7주 수업한 내용
    • 교재의 내용과 코드 중심
    • 문제 형식은 작년 중간고사 참고
  • 기말고사 범위
    • 전체 수업 범위

개인과제:

  • 데이터분석입문 과제 업로드를 위한 개인 github 저장소 구축
  • 개인과제 저장소 주소 업로드
  • 과제마감일
    • 2024.12.06(금)

팀과제:

  • 파이썬 언어를 활용하고 공공데이터 또는 토이데이터(toy data)인 pydataset을 사용해 데이터분석

    • 서울 날씨 데이터, 우리나라 읍면동 인구 데이터 분석을 참고해서 1시간 수업 분량의 데이터분석
    • 교재 8장 참고(패키지 pydataset과 다양한 데이터 파일 활용)
  • 제출 파일

    • [2024.11.19(화)까지] 과제계획서 제출, 반대표는 파일을 취합해서 교수에게 메일([email protected])로 전송
    • [2024.11.03(화)까지] 과제결과보고서 제출, 파일 3개(과제계획서, 과제결과보고서와 팀과제 파일(01조_*.ipynb)) 저장소 주소 업로드
    • A반
    • B반
  • 팀과제 발표일

    • 2024.12.04(수), 수업 중에 업로드 결과 파일인 ipynb 파일로 발표

공공데이터 사이트

  • 국내의 공공데이터 사이트는 다양한 분야의 데이터를 제공하여 연구, 정책 수립, 비즈니스 등 여러 용도로 활용될 수 있습니다. 아래는 주요 공공데이터 사이트 목록입니다.
  1. 한국 공공데이터 포털 data.go.kr

    • 한국 정부가 제공하는 공공데이터를 통합적으로 제공하는 플랫폼으로, 다양한 분야의 데이터셋을 검색하고 다운로드할 수 있습니다.
  2. 통계청 kostat.go.kr

    • 국가 통계에 대한 정보를 제공하며, 인구, 경제, 사회 등 다양한 통계 데이터를 제공합니다.
  3. KOSIS (한국통계정보시스템) kosis.kr

    • 통계청에서 제공하는 통계 데이터의 통합 플랫폼으로, 다양한 통계 자료를 검색하고 활용할 수 있습니다.
  4. 서울 열린 데이터 광장 data.seoul.go.kr

    • 서울시에서 제공하는 공공데이터로, 서울시의 다양한 정보와 데이터를 제공합니다.
  5. AI HUB aihub.or.kr

    • 인공지능 관련 데이터셋을 제공하는 플랫폼으로, AI 연구 및 개발에 필요한 데이터를 찾을 수 있습니다.
  6. 지역 데이터 포털 localdata.go.kr

    • 지역별 공공데이터를 제공하여 지역 발전 및 정책 수립에 활용할 수 있는 데이터를 제공합니다.
  7. 건강보험심사평가원 opendata.hira.or.kr

    • 건강보험 관련 데이터를 제공하며, 의료 및 건강 관련 연구에 유용합니다.
  8. 빅데이터 플랫폼 bigdata.seoul.go.kr

    • 서울시의 빅데이터를 활용한 다양한 서비스와 데이터를 제공합니다.

후반기 수업 코딩(PC의 vscode에서 수행 시):

  • 기준 폴더 [데이터분석A-w09-14] 또는 [데이터분석B-w09-14]에서 git bash를 실행해 다음 수행
    • git clone https://github.com/ai7dnn/2024-intro-DA.git
  • vscode에서 복제된 폴더 하부의 youtube-contents를 선택해 실행
  • 각 주피터노트북 파일 *.ipynb를 열어 select kernel에서 아나콘다의 (base)를 선택 후 실행
    • [09주] .../youtube-contents/lecture13-14-15-age-bar-pie.ipynb
    • [10주] .../youtube-contents/lecture16-17-18-age-gender-scatter.ipynb

후반기 수업 코딩(colab에서 수행 시):

강환수 교수의 유튜브 강좌(참고 강좌)

  • 걍 교수의 AIT code
  • 다음은 참고 유튜브 강좌로 본 수업의 내용과 다른 내용도 있습니다.
번호(수업주) 플립러닝 동영상(week 예습) 강좌 제목(유튜브 강좌 연결)
1 01주를 위한 예습자료 (01주 수업참고) 데이터분석입문 01차시 #01 Lecture 01 강의 소개
2 01주를 위한 예습자료 (01주 수업참고) 데이터분석입문 02차시 #02 Lecture 02 파이썬 개발환경 아나콘다 개요와 설치
3 01주를 위한 예습자료 (01주 수업참고) 데이터분석입문 03차시 #03 Lecture 03 파이썬 개발환경 주피터 노트북 실행
4 02주를 위한 예습자료 (02주 수업참고) 데이터분석입문 04차시 #04 Lecture 04 파이썬 자료형과 변수
5 02주를 위한 예습자료 (02주 수업참고) 데이터분석입문 05차시 #05 Lecture 05 입출력과 함수
6 02주를 위한 예습자료 (02주 수업참고) 데이터분석입문 06차시 #06 Lecture 06 조건과 반복
7 03주를 위한 자료 (03주 수업) 데이터분석입문 07차시 #07 Lecture 07 서울 기온 데이터분석 기초
8 03주를 위한 자료 (03주 수업) 데이터분석입문 08차시 #08 Lecture 08 서울 최고기온 데이터분석
9 03주를 위한 자료 (03주 수업) 데이터분석입문 09차시 #09 Lecture 09 matplotlib과 numpy 라이브러리
10 06주를 위한 예습자료 (06주 수업참고) 데이터분석입문 10차시 #10 Lecture 10 matplotlib 라이브러리로 그래프 그리기
11 06주를 위한 예습자료 (06주 수업참고) 데이터분석입문 11차시 #11 Lecture 11 matplotlib 한글폰트와 hist boxplot 그리기
12 06주를 위한 예습자료 (06주 수업참고) 데이터분석입문 12차시 #12 Lecture 12 matplotlib의 figure와 axes
13[11/06(수)] 데이터분석입문 13차시 #13 Lecture 13 서울의 크리스마스 기온 분석
14[11/06(수)] 데이터분석입문 14차시 #14 Lecture 14 서울의 최저 최고 기온 분석
15[11/06(수)] 07주를 위한 예습자료 (06~07주 수업참고) 데이터분석입문 15차시 #15 Lecture 15 matplotlib bar와 pie 그리기
16[11/13(수)] 데이터분석입문 16차시 #16 Lecture 16 인구 데이터 준비와 지역의 연령별 인구 데이터 분석
17[11/13(수)] 데이터분석입문 17차시 #17 Lecture 17 인구구조 연령별 성별 데이터분석
18[11/13(수)] 07주를 위한 예습자료 (06~07주 수업참고) 데이터분석입문 18차시 #18 Lecture 18 matplotlib의 scatter 그래프
19[11/20(수)] 07주를 위한 예습자료 (01~02주 수업참고) 데이터분석입문 19차시 #19 Lecture 19 vs code에서 노트북 활용
20[11/20(수)] 데이터분석입문 20차시 #20 Lecture 20 대중교통 데이터분석 기초
21[11/20(수)] 데이터분석입문 21차시 #21 Lecture 21 서울 지하철 승객 시간별 데이터 시각화
22[11/27(수)] 데이터분석입문 22차시 #22 Lecture 22 서울 지하철 이용 데이터 분석
23 04주를 위한 예습자료 (04주 수업참고) 데이터분석입문 23차시 #23 Lecture 23 과학 컴퓨팅 패키지 numpy
24[11/27(수)] 04주를 위한 예습자료 (04주 수업참고) 데이터분석입문 24차시 #24 Lecture 24 Numpy 배열 연산과 난수 생성
25 04주를 위한 예습자료 (04주 06~07주 수업참고) 데이터분석입문 25차시 #25 Lecture 25 NumPy와 matplotlib 활용
26[11/27(수)] 데이터분석입문 26차시 #26 Lecture 26 연령별 인구구조 유사지역 분석
27[11/27(수)] 데이터분석입문 27차시 #27 Lecture 27 데이터프레임을 위한 pandas 패키지
28 데이터분석입문 28차시 #28 Lecture 28 패키지 Pandas 활용
29 데이터분석입문 29차시 #29 Lecture 29 pandas로 올림픽 메달 집계 분석
30 데이터분석입문 30차시 #30 Lecture 30 pandas로 연령별 인구구조 유사지역 분석

image

About

2024학년도 2학기 데이터분석입문

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published