ADsP
1️⃣ 데이터 이해
1
2
- ERP : 회사의 정보 뿐 아니라 공급망 관리, 고객의 주문정보 등 통합적으로 관리
SCM : 외부 업체와 시스템 연계하여 비용최적화
2️⃣ 데이터 분석 기획
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
- 빅데이터 4V : 가비 크다속투
- Value 비즈니스효과(Return) | Volume,Variety,Velocity 투자비용(investment)
- SOW : 프로젝트에 참여하는 관계자들의 이해를 일치시키기 위한 목적으로 작성
- 분석 기회 발굴 : 거시적 관점의 영역 (STEEP)
- S Social | T Technological | E Economic | E Environmental | P Political
- 분석 준비도 (Readiness) : 업인 기데 문아
- 분석업무파악 | 인력 및 조직 | 분석기법 | 분석데이터 | 분석문화 | IT인프라
- 기업의 데이터 분석 도입의 수준을 파악하기 위한 준비방법
- 빅데이터 분석 방법론 : 기준 분시평
- 분석 기획 | 데이터 준비 | 데이터 분석 | 시스템 구현 | 평가 및 전개
- 회귀모형 가정 : 선독등비정
-
3️⃣ 데이터 분석
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
- Confusion Matrix 평가지표
- 정확도(Accuracy, 맞은 비율) : TP + TN / TP + TN + FP + FN
- 오차비율(Error Rate) : 1-정확도
- 민감도(재현율=Recall, 참 중에 긍정예측성공) : TP / TP + FN
- 정밀도(Percision, 긍정 중에 맞은 긍정예측성공) : TP / TP + FP
- 특이도(Specificity, 거짓 중에 긍정예측실패) : FP / TN + FP
- 사분위수 : 자료들의 중간 50%에 흩어진 정도를 나타내는 통계량
- Q1-1.5(IQR) < data < Q3+1.5(IQR) / IQR=Q3-Q1
- K-평균군집 절차 : 케할중반
- K개 객체선택 | 자료를 가장 가까운 군집에 할당 | 자료를 평균내어 중심 갱신 | 2,3 반복
- DBSCAN : 밀도 계산 기반으로 밀접하게 분포된 개체끼리 그룹핑
- 주성분 분석(PCA, Principal Component Analysis)
- 상관관계가 있는 고차원의 자료를 변동을 최대한 보존하여 저차원 자료로 변환하는 차원축소방법
- 제 1 주성분은 데이터를 가장 폭넓게 설명할 수 있는(분산이 가장 큰) 놈을 선택한다.
- 정상성 : 잔차항이 정규분포를 이뤄야 한다.