-
Notifications
You must be signed in to change notification settings - Fork 485
데이터 분석가
Sung Yun Byeon edited this page Feb 29, 2020
·
12 revisions
데이터 분석가는 전사적 의사결정을 위해 가설 및 KPI를 수립하고, 그 가설을 데이터로 검증(=분석)하는 일을 합니다. 그리고 종종 다른 부서에서 요청하는 데이터를 추출해 공유하는 일을 하기도 합니다. 아래 내용들을 가볍게 읽어보시고 추천 링크도 꼭 읽어보세요! :)
제 이야기가 궁금하신 분들은 데이터 사이언티스트가 되기 위해 진행한 다양한 노력들을 참고하시면 좋을 것 같습니다 :)
- DB에 쌓인 데이터 또는 대시보드 또는 애널리틱스 도구(Google Analytics, Facebook Analytics, ...)를 통해 전사적 의사결정에 도움이 될 데이터 분석을 실시
- 가설에 기반한 데이터 분석
- 타 부서의 요청 데이터 처리
- 주로 Business 팀, Operation 팀, Data 팀에 속함
- 신규 이벤트 로그 설계
- ex) 새로 추가되는 A 화면에서 회원가입하는 경우 로그 추가
- 기획자적 성향 존재 (가설 검증 및 결론 도출)
- 대시보드 생성 및 관리
- KPI(Key Performance Indicator : 핵심 성과 지표) 설정
- 로그 설계
- 데이터 추출 및 분석
- 통계 모델링
- SQL
- 전사적 의사결정
- 데이터에 기반한 KPI 기획
- 가설을 통한 분석
- 데이터 마이닝
- 애널리틱스 도구
- 데이터 시각화
- 도메인 지식 + 커뮤니케이션 능력
- 논리력 + 통계 지식
- 데이터 추출을 위한 SQL
- 데이터 가공을 위한 프로그래밍(R 또는 Python)
- 애널리틱스 도구
- Google Analytics, Facebook Analytics, Firebase Analytics, Flurry, Amplitude, etc
- 이번에 신규 기능을 추가하는데, 이 기능이 잘되고 있는지 어떻게 파악을 할까요?
-
- 문제 정의
- 목적 : 신규 기능의 활성화 파악
- 예) 신규 기능이 사진을 찍는 이벤트라면 사진 촬영량을 활성화 지표로 사용할 수 있지 않을까?
- 단, 절대 수치로 비교하기엔 매일 사용자가 다를 수 있으니 사용자 수로 나눠 비율로 파악하자
- 추상적 문제를 구체화
-
- 데이터 수집 및 전처리
- Database에서 SQL을 사용해 데이터를 추출
- 결론을 도출하기 위한 데이터 가공
- 좌측이 Raw 데이터고 우측이 가공한 데이터 주로 aggregate function을 사용해 데이터 가공
-
- 데이터 탐색 및 분석
- 2)에서 나온 다양한 테이블을 Join하거나 요일 데이터는 평일/주말로 나누어서 보는 등의 행동을 하며 분석
- Try & Error! 삽질이 난무하는 상황
-
- 결과 공유
- 분석 결과를 공유
- 분석의 기간은 언제인지, 가설은 무엇인지, 데이터를 통해 나온 결론은 무엇인지 작성
- 어떤 행동을 해야 더 나은 결과가 나올지 제시하면 Best. But 후속 행동 제시는 정말 어려운 일
- 적절한 시각화를 사용
-
- 저번 주 WAU는 얼마나 변동했나요?
- WAU : Weekly Active User. 1주에 해당 서비스를 사용한 유저수
- 우리 앱의 Retention은 얼마나 되나요? 어떻게 해야 늘릴 수 있을까요?
- AARRR 단계별 핵심 지표는 무엇으로 설정할까요?
- Acquisition : 어떻게 우리 서비스를 접하고 있는가
- Activation : 사용자가 처음 서비스를 이용할 때 긍정적인 경험을 제공하는가
- Retention : 이후의 서비스 재사용률은 어떻게 되는가
- Referral : 사용자가 자발적 바이럴, 공유를 일으키고 있는가
- Revenue : 최종 목적(매출)으로 연결되고 있는가
- 어느 포인트에서 고객이 이탈하나요?
- 연령대별 앱 사용 패턴이 어떤가요?
- 아시아 국가들의 DAU는 어떻게 되나요?
- 데이터 분석 책 읽기 : 린 분석, 그로스 해킹, 팩트풀니스
- AARRR, DAU, Session, Retention 등의 정의 파악
- 데이터를 가지고 계속 생각해보기(왜 그럴까?)
- 도메인 지식 쌓기는 공부하는 입장에선 매우 어렵지만, 발표 자료에서 발견하는 경우도 있음(iOS를 사용하는 유저들이 앱을 더 구입한다, 특정 앱 시장이 어떠한 상황이다 등)
- SQL 배우기
- SQL 레벨업 : SQL 기초 공부
- 데이터 분석을 위한 SQL 레시피 : SQL 심화 공부! 이 책은 정말 좋아요. 실무에서 활용한 내용 가득
- 프로그래밍 언어 배우기
- R 또는 Python
- 배운 언어로 데이터 가공하는 연습! 캐글에 데이터 많아요!
- 프로젝트 해보기
- 크고 어려운 프로젝트보다 일상의 데이터를 수집해 분석해보기
- 최규민님의 강남 출근길에 판교/정자역에 내릴 사람 예측하기
- 판교 정자역에 내릴 사람을 예측하기 위해 가설을 세우고, 데이터를 수집하고, EDA, 모델링하는 과정이 나온 자료입니다. 생활 데이터 분석해보세요!
- 데이터 지능 팟캐스트 E3: 생활 속 데이터 분석 팟캐스트도 들어보세요!
- 송근일님의 데이터 사이언티스트 현실
- 제 BigQuery의 모든 것 입문편
- 권정민님의 업계를 떠나는 과학자의 마음에 대한 소고 : 데이터 업계의 현실을 알려주는 글! 예상과 실제가 다릅니다
- 하용호님의 데이터는 차트가 아니라 돈이 되어야 한다 : 데이터를 액션으로 옮기는데 어떠한 어려움이 있고, 어떻게 타개해야 하는지에 대한 팁 존재
- 양승화님의 서비스 기획자를 위한 데이터 분석 시작하기 : 주니어 기획자를 위한 데이터분석 입문
- 송훈화님의 로그 데이터로 유저 이해하기 : 우아한 형제들에서 진행한 사례
- 김기태님의 고객 이탈 여부 예측 : 고객 이탈에 관련된 글
- 서하연님의 모바일 게임 데이터 분석 및 실전 활용 : 모바일 게임에서 데이터 분석을 어떻게 하는지 나온 자료
- 이은조님의 데이터 분석을 이용한 게임 고객 모델링 : 게임에서 고객을 어떻게 모델링하는지 알 수 있는 자료
카일스쿨 유튜브를 시작했습니다-! 이 Wiki 문서에서 다루지 않은 현업 이야기를 공유할 예정입니다!
궁금하시거나 요청할 내용이 있으시면 [email protected]으로 메일 보내주시면 감사하겠습니다 :)