[분석과제 발굴 방법론]
1. 개요
- 분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계자들이 수행할 수 있는 '과제 정의서 형태'로 도출됨
- 분석과제를 도출하기 위한 방식으로는 크게 하향식 접근방법 / 상향식 접근방법이 존재
- 최적의 의사결정은 두 접근 방식이 상호 보완관계에 있을 때 가능
대상 | ||
방법 | 최적화 | 통찰 |
솔루션 | 발견 | |
TOP-DOWN 접근 (Problem Solving) |
Bottom-UP 접근 (Problem Creator) |
[하향식 접근방법]
- 논리적인 단계별 접근법으로, 각 과정이 체계적으로 단계화되어 수행하는 방식
- 솔루션 도출에는 유용하나 새로운 문제 탐색에는 한계 존재
문제탐색 | 문제정의 | 해결방안탐색 | 타당성검토 |
1) 비즈니스모델기반 문제탐색 2) 분석기회 발굴의 범위확장 3) 외부사례기반 |
비즈니스문제를 데이터분석 문제로 변환 | 수행 옵션 도출 | 타당성평가(경제성,데이터, 기술) |
1단계. 문제탐색
- 빠짐없이 문제를 도출하고 식별하는 것이 중요
- 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요
1) 비즈니스 모델 기반 문제탐색 (5가지 발굴영역)
= 기업 내외부 환경을 포괄하고 있는 비즈니스 모델이라는 프레임을 활용하여, 비즈니스모델 캔버스의 9가지 블록을 단순화하여 총 5가지 영역에 대한 과제를 도출하는 작업
① 업무 operation : 내부 프로세스 및 주요자원 관련 주제 도출
② 제품 product: 제품 및 서비스를 개선하기 위한 주제 도출
③ 고객 customer: 사용자 및 고객, 이를 제공하는 채널의 관점에서 주제 도출
④ 규제와 감사 regulation, audit : 제품 생산 및 전달 과정 중 발생하는 규제와 보안의 관점에서 주제 도출
⑤ 지원 인프라 IT&Human resources: 분석 시스템 영역 및 인력의 관점에서 주제 도출
2) 분석기회 발굴의 범위 확장 (4가지 관점)
① 거시적 관점의 메가트랜드
- 조직 및 해당 산업에 폭넓게 영향을 미치는 사회,경제적 요인을 STEEP 영역으로 나누어 바라봄
- Social 사회 / Tech 기술 / Economic 경제 / Environment 환경 / Political 정치
② 경쟁사 확대 관점 : 대체재 / 경쟁자 / 신규 진입자
③ 시장의 니즈 탐색 관점 : 고객/ 채널/ 영향자
④ 역량의 재해석 관점: 내부 역량 / 파트너와 네트워크
3) 외부참조 모델기반 문제탐색 (=벤치마킹)
- quick & easy 방식으로 필요한 분석기회가 무엇인지에 대한 아이디어를 얻고, 기업에 적용할 분석테마 후보 목록을 브레인스토밍을 통해 빠르게 도출하는 방법
2단계. 문제정의
- 식별된 '비즈니스 문제'를 '데이터의 문제'로 변환하는 단계
- 목표를 달성하기 위해 필요한 데이터 및 기법 (how)을 정의하기 위한 과정
- 데이터 분석 문제의 정의 및 요구사항 = 분석 수행자 뿐 아니라 문제가 해결되었을 때 효용을 얻는 최종사용자의 관점에서 이루어져야 함.
3단계. 해결방안탐색
- 정의된 데이터분석문제를 해결하기 위한 다양한 방안이 모색됨
-분석역량과 분석기법 현황에 따른 해결방안 탐색이 필요
분석역량 | ||
분석기법 및 시스템 | 기존시스템 개선활용 | 교육 및 채용 |
시스템 고도화 | 전문업체 탐색 |
4단계. 타당성검토
① 경제성: 비용대비 편익분석 관점의 접근 필요
② 데이터
③ 기술적 타당성
[상향식 접근법]
1. 정의
- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치있는 모든 문제를 도출하는 과정
- 기존의 논리적인 단계별 접근법(하향식)은 문제 도출에는 유효하지만, 새로운 문제 탐색에는 한계가 있었기에 최근의 복잡하고 다양한 환경에서 발생하는 문제에는 적합하지 않을 수 있음
- 이를 해결하기 위해 Design Thinking 접근법을 통해 전통적 분석 사고를 극복하기 위한 방안이 대두
- what의 관점에서 사물을 바라보며, Empathy / Define / Ideate / Prototype / Test 프로세스
2. 비지도학습과 지도학습
1) 비지도학습
- 일반적으로 상향식 접근방식의 데이터분석은 '비지도 학습' 방법에 의해 수행
- 데이터 자체의 결함, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것
- 데이터마이닝 기법 예시 ) 장바구니 분석, 군집분석, 기술 통계, 프로파일링
2) 지도학습
- 명확한 목적 하에 데이터 분석을 실시하는 것
- 분류, 추측, 예측, 최적화를 통해 사용자의 주도로 분석을 실시하고 지식 도출함이 목적
3. 프로토타이핑 접근법
1) 정의
- 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고, 소스의 명확한 파악이 어려운 상황에서 '일단 분석을 시도해 보고 그 결과를 통해 반복적으로 개선해 나가는 방법' 을 뜻함
- 신속하게 해결 모형을 제시함으로써 문제를 구체화할 수 있게 하는 상향식 접근 방식
- 기본적인 프로세스
가설 생성 > 디자인에 대한 실험 > 실제 환경에서의 테스트 > 테스트 결과에서의 통찰 도출 및 가설확인
2) 빅데이터 분석 환경에서 프로토타이핑의 필요성
① 문제에 대한 인식 수준 : 문제 정의가 불명확한 경우 문제 이해 및 구체화에 도움이 됨
② 필요 데이터 존재여부의 불확실성 : 데이터 존재 여부에 따른 사용자와 분석자 간의 협의 과정
③ 데이터 사용 목적의 가변성 : 데이터의 가치는 지속적으로 변하기에
[분석 과제 관리]
: 분석 기회가 과제 형태로 도출되고 나면, 5가지 주요 속성을 고려한 추가적인 관리가 필요
1) 데이터양 Data Size
- 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립 필용
2) 데이터 복잡도 Data Complexity
- 정형데이터 분석과 달리 비정형 및 다양한 원천 데이터를 통합해서 분석 진행 시 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요
3) 분석 모델 스피드 Speed
- 시나리오 측면에서의 속도 고려 필요
- 분석 모델의 성능 및 속도를 고려한 가설 및 테스트 수행
4) 분석모델 복잡도 Analytic Complexity
- 분석모델이 복잡할수록 정확도는 올라가지만, 해석이 어려워지기에 기준점을 사전 정의해둠이 좋음
- 해석이 가능하면서도 정확도를 올릴 수 있는 최적모델을 찾는 방안 사전 모색
5) 정확과 일관성 Accuracy & Precision
- 정확도 : 모델과 실제값 사이의 차이가 적음을 의미 (활용도 측면)
- 일관성: 모델을 지속적으로 반복했을 때의 편차의 수준, 일관적으로 동일한 결과를 제시함을 의미 (안전성 측면)
'ADsP > 2과목' 카테고리의 다른 글
2-1. 분석 기획& 분석방법론 (KDD, CRISP-DM, 빅데이터) (0) | 2022.09.12 |
---|