Home ADsP(Advanced Data Analytics Semi-Professional) 취득기
Post
Cancel

ADsP(Advanced Data Analytics Semi-Professional) 취득기

ADsP

1️⃣ 데이터 이해

1
2
- ERP : 회사의 정보 뿐 아니라 공급망 관리, 고객의 주문정보 등 통합적으로 관리
  SCM : 외부 업체와 시스템 연계하여 비용최적화

2️⃣ 데이터 분석 기획

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
- 빅데이터 4V : 가비 크다속투
  - Value 비즈니스효과(Return) | Volume,Variety,Velocity 투자비용(investment)

- SOW : 프로젝트에 참여하는 관계자들의 이해를 일치시키기 위한 목적으로 작성

- 분석 기회 발굴 : 거시적 관점의 영역 (STEEP)
  - S Social | T Technological | E Economic | E Environmental | P Political

- 분석 준비도 (Readiness) : 업인 기데 문아
  - 분석업무파악 | 인력 및 조직 | 분석기법 | 분석데이터 | 분석문화 | IT인프라
  - 기업의 데이터 분석 도입의 수준을 파악하기 위한 준비방법

- 빅데이터 분석 방법론 : 기준 분시평
  - 분석 기획 | 데이터 준비 | 데이터 분석 | 시스템 구현 | 평가 및 전개

- 회귀모형 가정 : 선독등비정
  - 

3️⃣ 데이터 분석

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
- Confusion Matrix 평가지표 
  - 정확도(Accuracy, 맞은 비율) : TP + TN / TP + TN + FP + FN 
  - 오차비율(Error Rate) : 1-정확도
  - 민감도(재현율=Recall, 참 중에 긍정예측성공) : TP / TP + FN
  - 정밀도(Percision, 긍정 중에 맞은 긍정예측성공) : TP / TP + FP
  - 특이도(Specificity, 거짓 중에 긍정예측실패) : FP / TN + FP

- 사분위수 : 자료들의 중간 50%에 흩어진 정도를 나타내는 통계량
  -  Q1-1.5(IQR) < data < Q3+1.5(IQR) / IQR=Q3-Q1

- K-평균군집 절차 : 케할중반
  - K개 객체선택 | 자료를 가장 가까운 군집에 할당 | 자료를 평균내어 중심 갱신 | 2,3 반복

- DBSCAN : 밀도 계산 기반으로 밀접하게 분포된 개체끼리 그룹핑

- 주성분 분석(PCA, Principal Component Analysis)
  - 상관관계가 있는 고차원의 자료를 변동을 최대한 보존하여 저차원 자료로 변환하는 차원축소방법
  - 제 1 주성분은 데이터를 가장 폭넓게 설명할 수 있는(분산이 가장 큰) 놈을 선택한다.

- 정상성 : 잔차항이 정규분포를 이뤄야 한다.
This post is licensed under CC BY 4.0 by the author.