ADsP/2과목

2-2. 분석과제 발굴 방법론 (하향식, 상향식)

RECORD WHO (레코드후) 2022. 9. 12. 16:33

[분석과제 발굴 방법론]

1. 개요

-  분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 관계자들이 수행할 수 있는 '과제 정의서 형태'로 도출됨

- 분석과제를 도출하기 위한 방식으로는 크게 하향식 접근방법 / 상향식 접근방법이 존재

- 최적의 의사결정은 두 접근 방식이 상호 보완관계에 있을 때 가능

  대상
방법 최적화 통찰
솔루션 발견
  TOP-DOWN 접근
(Problem Solving) 
Bottom-UP 접근
(Problem Creator) 

 

[하향식 접근방법] 

- 논리적인 단계별 접근법으로, 각 과정이 체계적으로 단계화되어 수행하는 방식

- 솔루션 도출에는 유용하나 새로운 문제 탐색에는 한계 존재 

 

문제탐색 문제정의 해결방안탐색 타당성검토
1) 비즈니스모델기반 문제탐색
2) 분석기회 발굴의 범위확장
3) 외부사례기반
비즈니스문제를 데이터분석 문제로 변환 수행 옵션 도출 타당성평가(경제성,데이터, 기술) 

1단계. 문제탐색

- 빠짐없이 문제를 도출하고 식별하는 것이 중요

- 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요

 

1) 비즈니스 모델 기반 문제탐색 (5가지 발굴영역) 

= 기업 내외부 환경을 포괄하고 있는 비즈니스 모델이라는 프레임을 활용하여, 비즈니스모델 캔버스의 9가지 블록을 단순화하여 총 5가지 영역에 대한 과제를 도출하는 작업 

① 업무 operation : 내부 프로세스 및 주요자원 관련 주제 도출

② 제품 product: 제품 및 서비스를 개선하기 위한 주제 도출

③ 고객 customer: 사용자 및 고객, 이를 제공하는 채널의 관점에서 주제 도출

④ 규제와 감사 regulation, audit : 제품 생산 및 전달 과정 중 발생하는 규제와 보안의 관점에서 주제 도출

⑤ 지원 인프라 IT&Human resources: 분석 시스템 영역 및 인력의 관점에서 주제 도출 

 

2) 분석기회 발굴의 범위 확장 (4가지 관점) 

① 거시적 관점의 메가트랜드 

- 조직 및 해당 산업에 폭넓게 영향을 미치는 사회,경제적 요인을 STEEP 영역으로 나누어 바라봄

- Social 사회 / Tech 기술 / Economic 경제 / Environment 환경 / Political 정치 

② 경쟁사 확대 관점 : 대체재 / 경쟁자 / 신규 진입자

③ 시장의 니즈 탐색 관점 : 고객/ 채널/ 영향자 

④ 역량의 재해석 관점: 내부 역량 / 파트너와 네트워크 

 

3) 외부참조 모델기반 문제탐색 (=벤치마킹) 

- quick & easy 방식으로 필요한 분석기회가 무엇인지에 대한 아이디어를 얻고, 기업에 적용할 분석테마 후보 목록을 브레인스토밍을 통해 빠르게 도출하는 방법

 

2단계. 문제정의

- 식별된 '비즈니스 문제'를 '데이터의 문제'로 변환하는 단계

- 목표를 달성하기 위해 필요한 데이터 및 기법 (how)을 정의하기 위한 과정

- 데이터 분석 문제의 정의 및 요구사항 = 분석 수행자 뿐 아니라 문제가 해결되었을 때 효용을 얻는 최종사용자의 관점에서 이루어져야 함. 

 

3단계. 해결방안탐색

- 정의된 데이터분석문제를 해결하기 위한 다양한 방안이 모색됨

-분석역량과 분석기법 현황에 따른 해결방안 탐색이 필요

  분석역량
분석기법 및 시스템 기존시스템 개선활용 교육 및 채용
시스템 고도화 전문업체 탐색

4단계. 타당성검토 

① 경제성:  비용대비 편익분석 관점의 접근 필요

② 데이터 

③ 기술적 타당성 

 

[상향식 접근법]

1. 정의

- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치있는 모든 문제를 도출하는 과정

- 기존의 논리적인 단계별 접근법(하향식)은 문제 도출에는 유효하지만, 새로운 문제 탐색에는 한계가 있었기에 최근의 복잡하고 다양한 환경에서 발생하는 문제에는 적합하지 않을 수 있음

- 이를 해결하기 위해 Design Thinking 접근법을 통해 전통적 분석 사고를 극복하기 위한 방안이 대두

- what의 관점에서 사물을 바라보며, Empathy / Define / Ideate / Prototype / Test  프로세스 

 

2. 비지도학습과 지도학습

1) 비지도학습

- 일반적으로 상향식 접근방식의 데이터분석은 '비지도 학습' 방법에 의해 수행

- 데이터 자체의 결함, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것

- 데이터마이닝 기법 예시 ) 장바구니 분석, 군집분석, 기술 통계, 프로파일링 

2) 지도학습

- 명확한 목적 하에 데이터 분석을 실시하는 것

- 분류, 추측, 예측, 최적화를 통해 사용자의 주도로 분석을 실시하고 지식 도출함이 목적 

 

3. 프로토타이핑 접근법

1) 정의

- 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고, 소스의 명확한 파악이 어려운 상황에서 '일단 분석을 시도해 보고 그 결과를 통해 반복적으로 개선해 나가는 방법' 을 뜻함

- 신속하게 해결 모형을 제시함으로써 문제를 구체화할 수 있게 하는 상향식 접근 방식

- 기본적인 프로세스

가설 생성 > 디자인에 대한 실험 > 실제 환경에서의 테스트 > 테스트 결과에서의 통찰 도출 및 가설확인 

 

2) 빅데이터 분석 환경에서 프로토타이핑의 필요성

① 문제에 대한 인식 수준 : 문제 정의가 불명확한 경우 문제 이해 및 구체화에 도움이 됨

② 필요 데이터 존재여부의 불확실성 : 데이터 존재 여부에 따른 사용자와 분석자 간의 협의 과정 

③ 데이터 사용 목적의 가변성 : 데이터의 가치는 지속적으로 변하기에 

 

[분석 과제 관리]

: 분석 기회가 과제 형태로 도출되고 나면, 5가지 주요 속성을 고려한 추가적인 관리가 필요

1) 데이터양 Data Size

- 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립 필용

2) 데이터 복잡도 Data Complexity 

- 정형데이터 분석과 달리 비정형 및 다양한 원천 데이터를 통합해서 분석 진행 시 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요

3) 분석 모델 스피드 Speed 

- 시나리오 측면에서의 속도 고려 필요

- 분석 모델의 성능 및 속도를 고려한 가설 및 테스트 수행

4) 분석모델 복잡도 Analytic Complexity 

- 분석모델이 복잡할수록 정확도는 올라가지만, 해석이 어려워지기에 기준점을 사전 정의해둠이 좋음

- 해석이 가능하면서도 정확도를 올릴 수 있는 최적모델을 찾는 방안 사전 모색

5) 정확과 일관성 Accuracy & Precision

- 정확도 : 모델과 실제값 사이의 차이가 적음을 의미 (활용도 측면) 

- 일관성: 모델을 지속적으로 반복했을 때의 편차의 수준, 일관적으로 동일한 결과를 제시함을 의미 (안전성 측면)

'ADsP > 2과목' 카테고리의 다른 글

2-1. 분석 기획& 분석방법론 (KDD, CRISP-DM, 빅데이터)  (0) 2022.09.12