데이터분석 준전문가(ADsP)

[ADsP] 2-1. 데이터 분석 기획의 이해

✨️데이터분석가✨️ 2023. 5. 17. 08:00
728x90
728x90

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로

2과목. 데이터 분석 기획의 "제1장. 데이터 분석 기획의 이해"입니다.
출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다!


[목차]
2과목. 데이터 분석 기획
 제1장. 데이터 분석 기획의 이해
          1. 분석기획 방향성 도출
          2. 분석 방법론
          3. 분석 과제 발굴
          4. 분석 프로젝트 관리 방안

 

1. 분석기획 방향성 도출

 

1) 분석기획의 특징

- 수학/통계적 지식 및 프로그래밍 기술 역량을 가지고 방향성과 계획 수립한다는 것을 의미함

구분 분석 대상 (What)
Known Un-Known
분석 방법 (How) Known 최적화
(Optimization)
통찰
(Insight)
Un-Known 솔루션
(Solution)
발견
(Discovery)

 

2) 분석 기획시 고려사항

- 가용 데이터에 대한 고려 필요

- 적절한 활용방안과 유즈케이스 탐색 필요

- 장애요소들에 대한 사전계획 수립 필요

 


2. 분석 방법론

 

1) 분석 방법론 개요

(1) 의사결정을 가로막는 장애요소

- 고정 관념, 편향된 생각, 프레이밍 효과

 

(2) 방법론의 적용 업무의 특성에 따른 모델

- 폭포수 모델: 단계를 순차적으로 진행하는 방법

- 프로토타입 모델: 점진적으로 개발하는 방법 (일부분 우선 개발)

- 나선형 모델: 반복해서 점증적으로 개발하는 방법

 

(3) 방법론의 구성

- 단계(Phase): 단계별 산출물 생성

- 태스크(Task): 단계를 구성하는 단위 활동, 품질 검토의 항목

- 스탭(Step): 단위 프로세스

 

2) KDD 분석 방법론 (데이터 마이닝 프로세스)  

데이터셋 선택 비즈니스 도메인 이해 및 프로젝트 목표 설정
분석에 필요한 목표데이터를 구성하여 분석에 활용
데이터 전처리 잡음, 이상치, 결측치 식별하고 데이터셋을 정제하는 단계
데이터 변환 변수 생성/선택 및 데이터 차원 축소
학습용 vs. 검증용 데이터를 분리하는 단계
④ 데이터 마이닝 데이터마이닝 기법 선택
⑤ 데이터 마이닝 결과 평가 결과 해석 및 평가, 분석목적과의 일치성 확인

 

3) CRISP-DM 분석 방법론

(1) CRISP-DM 4레벨 구조

- 단계 → 일반화 태스크 → 세분화 태스크 → 프로세스 실행

 

(2) CRISP-DM 프로세스

업무 이해 목적 및 요구사항 이해
② 데이터 이해 데이터 수집 및 속성 이해, 인사이트 발견
③ 데이터 준비 분석기법에 적합한 데이터셋 선택정제
모델링 모델링 기법과 알고리즘 선택, 파라미터 최적화
평가 결과가 프로젝트 목적에 부합하는지 평가
전개 업무 적용 계획 수립, 유지보수 계획 마련

 

4) 빅데이터 분석 방법론 (5단계)

분석 기획 - 비즈니스 이해 및 범위 설정
- 프로젝트 정의 및 계획 수립
- 프로젝트 위험 계획 수립
- 범위정의서(SOW)
- 수행계획서(WBS)
- 위험목록, 위험관리계획서
② 데이터 준비 - 필요 데이터 정의
- 데이터 스토어 설계
- 데이터 수집 및 정합성 검정
- 데이터 정의서, 데이터 획득 계획서
- 정형/비정형 데이터 스토어 설계서
- 수집 데이터, 정합성 점검 보고서
③ 데이터 분석 - 분석용 데이터 준비
- 텍스트 분석
- 탐색적 분석
- 모델링
- 모델 평가 및 검증
- 모델 적용 및 운영방안 수립
- 목표/범위 확인, 정형/비정형 데이터 추출
- 모델 구축, 용어사전 확보
- 기초통계량 산출, 프로토타입(시각화) 활용
- 훈련용/테스트용 분할, 모델 테스트
- 모델 평가 진행, 실적용성 검증
- 알고리즘 설멍서 작성, 모니터링 방안 수립
시스템 구현 - 설계 및 구현
- 시스템 테스트 및 운영
- 설계서, 설계된 모델 구현 시스템
- 운영자/사용자 교육, 운영 계획서
평가 및 전개 - 모델 발전계획 수립
- 프로젝트 평가 및 보고
- 모델 발전 계획서
- 성과 평가서, 최종 보고서

 


3. 분석 과제 발굴

 

1) 하향식 접근법 (Top-down)

문제 탐색 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요
- 비즈니스 모델기반 문제탐색 방법
  : 업무(프로세스 및 주요 자원), 제품(제품/서비스 개선), 고객(채널관점)
  : 규제와 감사(규제 및 보안 관점), 지원 인프라(인력 관점)
- 분석 기회 발굴의 범위 확장
  : 거시적 관점(사회, 기술, 경제, 환경, 정치)
  : 경쟁자 확대 관점(대체재, 경쟁자, 신규 진입자)
  : 시장의 니즈 탐색 관점(고객, 채널, 영향자)
  : 역량의 재해석 관점(내부 역량, 파트너와 네트워크)
- 외부사례 기반 문제탐색(벤치마킹)
- 분석 유즈 케이스
문제 정의 - 비즈니스 문제를 분석의 관점으로 문제를 재정의
해결방안 탐색 - 분석 문제 해결을 위한 방안 모색
타당성 검토 - 경제적, 데이터기술적 타당성 검토

 

2) 상향식 접근법 (Botton-up)

(1) 정의

- 분석을 통해 발생 원인을 역으로 추적하면서 문제를 탐색하는 방법

- 비지도 학습 방법에 의해 데이터 분석

지도 학습 비지도 학습
명확한 목적 하에 데이터 분석 실시
결과 값을 사전에 인지하고, 특정 결과 값을 예측
데이터 자체만으로 데이터의 상태 표현
그룹화를 통해 인사이트를 도출
예) 장바구니 분석, 군집 분석 등

 

3) 디자인 사고 접근법 (Design Thinking)

- 상향식 + 하향식 접근법을 수행하여 상호 보완적인 최적의 의사결정 방식

- 사물을 있는 그대로 인식하는 What의 관점에서 보아야 함

- 감정이입 강조

 

4) 프로토타이핑 접근법

- 일단 분석하여 반복적으로 개선해 나가는 방법

- 유용한 상향식 접근 방식

- 문제 정의 불명확, 데이터 존재 여부의 불확실, 데이터 사용 목적의 가변하는 경우 활용

 


4. 분석 프로젝트 관리 방안

 

1) 분석과제 관리를 위한 5가지 주요 영역

- ①데이터 크기, ②데이터 복잡성, ③속도, ④분석 복잡성(최적모델 발굴), ⑤정확성/정밀도

- 정확도↑ 복잡성↓/ 정확도↑ → 정밀도↓

 

2) 분석 프로젝트 관리방안

- 범위, 시간, 원가, 품질, 통합, 조달, 자원, 리스크, 의사소통, 이해관계자

 

 

위 내용은 [ADsP 데이터분석 준전문가, (주)데이터에듀]를 참고하여 요약한 자료입니다.

728x90
728x90