728x90
728x90

데이터분석 준전문가(ADsP) 11

[ADsP] 3-3. 정형 데이터 마이닝(2)

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 3과목. 데이터 분석의 "제3장. 정형 데이터 마이닝"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 3과목. 데이터 분석 제3장. 정형 데이터 마이닝 3. 군집분석 4. 연관분석 3. 군집분석 - [군집 내 유사성] 및 [다른 군집 간 상이성]을 규명하는 분석 방법 - 상품구매행동 or 소비자군 분류하여 시장전략수립 등에 활용 구분 거리 내용 연속형 변수 유클리디안 거리 데이터간 유사성 측정 변수들의 산포 정도가 감안되어 있지 않음 표준화 거리 표준편차로 척도 변환 후, 유클리드안 거리를 계산하는 방법 마할라노비스 거리 변수들의 산포를 고려하여 표준화한 거리 두 벡터 사이의 거리를..

[ADsP] 3-3. 정형 데이터 마이닝(1)

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 3과목. 데이터 분석의 "제3장. 정형 데이터 마이닝" 입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 3과목. 데이터 분석 제3장. 정형 데이터 마이닝 1. 데이터 마이닝 개요 2. 분류분석 1. 데이터 마이닝 개요 1) 데이터마이닝 - 의미 있는 패턴 파악/예측하여 의사결정에 활용하는 방법 (1) 분석 방법 지도학습 비지도학습 - 의사결정나무 - 인공신경망 - 회귀분석, 로지스틱 회귀분석 - 최근접 이웃법(KNN) - OLAP - 연관성 규칙발견 - 군집분석 - SOM (2) 분석 유형 및 기법 분류규칙 연관규칙 연속규칙 데이터군집화 과거 데이터로 특성을 찾아 분류모형으로 결과값..

[ADsP] 3-2. 통계분석(2)

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 3과목. 데이터 분석의 "제2장. 통계분석" 입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 3과목. 데이터 분석 제2장. 통계분석 3. 다변량 분석 4. 시계열 예측 3. 다변량 분석 1) 회귀분석 (1) 회귀분석 - 독립변수들이 종속변수에 미치는 영향을 추정 선형성 등분산성 독립성 비상관성 정규성 X,Y 관계가 선형 잔차와 독립변수는 무관함 오차와 독립변수는 무관함 오차끼리 무관함 오차의 분포가 정규분포 *오차: 모집단 실제값 vs. 회귀선과의 차이 (정확치와 관측치의 차이) 잔차: 표본 관측값 vs. 회귀선과의 차이 구분 단순선형회귀분석 다중선형회귀분석 정의 독립변수 한 개 독..

[ADsP] 3-2. 통계분석(1)

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 3과목. 데이터 분석의 "제2장. 통계분석" 입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 3과목. 데이터 분석 제2장. 통계분석 1. 통계학 개론 2. 기초 통계분석 1. 통계학 개론 1) 통계자료 2) 표본추출 방법 - 단순랜덤 추출법: 임의의 n개 추출(선택 확률 동일) - 계통추출법: 구간을 나누고 첫 구간에서 하나를 임의로 선택, K개씩 띄어서 n개 표본 선택 - 집락추출법: 군집을 구분, 단순랜덤으로 군집 추출, 추출된 군집 모두 활용 or 샘플링 - 층화추출법: 유사 원소끼리 층으로 구분, 각 층에서 랜덤 추출 (층 내 동질, 층 간 이질) 3) 측정방법 종류 척도 정..

[ADsP] 3-1. R 기초와 데이터 마트

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 3과목. 데이터 분석의 "제1장. R 기초와 데이터 마트" 입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 3과목. 데이터 분석 제1장. R 기초와 데이터 마트 0. 데이터 분석 기법의 이해 1. R 기초 2. 데이터 마트 3. 결측값 처리와 이상값 검색 0. 데이터 분석 기법의 이해 1) 데이터 처리 - 데이터웨어하우스(DW)와 데이터마트(DM)로 분석 데이터를 가져옴 - 이 외 '기존 운영시스템', '스테이징 영역', 'ODS'에서도 가져와 결합함 2) 탐색적 자료 분석 (EDA) - 구조적 관계를 알아내기 위한 기법들의 통칭 - '저항성의 강조', '잔차 계산', '자료변수의 ..

[ADsP] 2-2. 분석 마스터 플랜

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 2과목. 데이터 분석 기획의 "제2장. 분석 마스터 플랜"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 2과목. 데이터 분석 기획 제2장. 분석 마스터 플랜 1. 마스터 플랜 수립 프레임 워크 2. 분석 거버넌스 체계 수립 1. 마스터 플랜 수립 프레임 워크 1) 분석 마스터 플랜 수립 프레임 워크 (1) 마스터 플랜 수립 개요 우선순위 고려요소 적용범위/방식 고려요소 ① 전략적 중요도 ② 비즈니스 성과 / ROI ③ 실행 용이성 ① 업무 내재화 적용 수준 ② 분석 데이터 적용 수준 ③ 기술 적용 수준 (2) 사분면 분석을 통한 우선순위 선정 - 시급성이 우선이면, Ⅲ → Ⅳ → ..

[ADsP] 2-1. 데이터 분석 기획의 이해

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 2과목. 데이터 분석 기획의 "제1장. 데이터 분석 기획의 이해"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 2과목. 데이터 분석 기획 제1장. 데이터 분석 기획의 이해 1. 분석기획 방향성 도출 2. 분석 방법론 3. 분석 과제 발굴 4. 분석 프로젝트 관리 방안 1. 분석기획 방향성 도출 1) 분석기획의 특징 - 수학/통계적 지식 및 프로그래밍 기술 역량을 가지고 방향성과 계획 수립한다는 것을 의미함 구분 분석 대상 (What) Known Un-Known 분석 방법 (How) Known 최적화 (Optimization) 통찰 (Insight) Un-Known 솔루션 (Solu..

[ADsP] 1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 1과목. 데이터의 이해의 "제3장. 가치 창조를 위한 데이터 사이언스와 전략 인사이트"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 1과목. 데이터의 이해 제3장. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 1. 빅데이터 분석과 전략 인사이트 2. 전략 인사이트 도출을 위한 필요 역량 3. 빅데이터 그리고 데이터 사이언스의 미래 # 최신 빅데이터 상식 1. 빅데이터 분석과 전략 인사이트 - 빅데이터에 초점을 두지 말고, 분석을 통해 가치/통찰을 얻는 것에 집중해야 함 - 전략적인 통찰력을 가지고 핵심적인 이슈에 집중하여 차별화된 전략적 인사이트를 주는 가치기반 분석에 집중해..

[ADsP] 1-2. 데이터의 가치와 미래

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 1과목. 데이터의 이해의 "제2장. 데이터의 가치와 미래"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 1과목. 데이터의 이해 제2장. 데이터의 가치와 미래 1. 빅데이터의 이해 2. 빅데이터의 가치와 영향 3. 비즈니스 모델 4. 위기 요인과 통제 방안 5. 미래의 빅데이터 1. 빅데이터의 이해 1) 빅데이터의 정의 - 3V ★★ ① Volume(양): 규모 ② Variety(다양성): 유형(정형, 비정형) ③ Velocity(속도): 추출 및 분석속도 - 4V ④ Veracity(신뢰성) ④ Value(가치) ④ Visualization(시각화) 2) 빅데이터의 기능 - 산업혁..

[ADsP] 1-1. 데이터의 이해

[데이터분석 준전문가, ADsP] 자격증 시험 요약자료로 1과목. 데이터의 이해의 "제1장. 데이터의 이해"입니다. 출제 빈도가 높은 내용 위주로 요약했으니, 이 자료로 공부하시는 모든 분들 합격하시길 바랍니다! [목차] 1과목. 데이터의 이해 제1장. 데이터의 이해 1. 데이터와 정보 2. 데이터베이스 정의와 특징 3. 데이터베이스 활용 1. 데이터와 정보 1) 데이터의 정의 - 데이터는 추론과 추정의 근거를 이루는 사실 2) 데이터의 유형 ★★ 정성적 데이터 정량적 데이터 비정형, 주관적 내용 언어, 문자로 표현 통계분석이 어려움 예) 맛 후기, 영화 감상평 등 정형, 객관적 내용 수치, 도형, 기호로 표현 통계분석이 용이함 예) 나이, 몸무게, 주가 등 3) 지식경영의 핵심 이슈 ★★ 암묵지 형식지..

728x90
728x90