[3과목] 3-4. 통계분석 (1)통계분석 이해
1절. 통계분석의 이해 1. 통계란? - 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 2. 통계 자료의 획득 방법 1) 총조사/ 전수조사 census - 대상 집단 모두를
jjou-adblog.tistory.com
1. 기술통계 : 자료의 특성을 표, 그림 등을 사용해 정리/요약하는 것
1) 통계량에 의한 자료 정리
① 중심 위치의 측도 : 표본평균, 중앙값, 최빈값
② 산포의 측도: 분산, 표준편차, 사분위수범위 등
③ 분포의 형태에 관한 측도
c-1. 왜도 : 분포의 비대칭 정도를 나타내는 측도

c-2. 첨도 : 분포의 중심에서 뾰족한 정도

2) 그래프를 이용한 자료 정리
① 막대그래프 vs 히스토그램
막대그래프 | 히스토그램 |
범주형으로 구분된 데이터 (직업, 종교, 음식 등) 범주 순서 의도에 따라 변경 가능 그래프 가로줄 데이터 사이에 공간 존재 |
연속형으로 표시된 데이터 (몸무게, 성적, 연봉 등) 임의로 순서 변경 불가 그래프 상 막대 사이 간격이 없음 |
② 줄기-잎 그림 (stem-and leaf plot) : 데이터를 줄기와 잎의 모양으로 그린 그림
③ 상자그림 (box plot) : 다섯 숫자 요약을 통해 그림으로 표현
- 이상치 구하는 공식 : Q1-(1.5*IQR) // Q3+(1.5*IQR)
2. 상관분석
1) 정의
- 두 변수 간의 상관 정도(방향성, 밀접도 등)을 알아보기 위한 분석방법
- 상관계수를 통해 인과관계, 분산은 알 수 없음
- 상관계수 값은 항상 -1과 1 사이에 존재
0.7<r<1 | 강한 양/음의 상관관계 |
0.3<r<0.7 | 약한 양/음의 상관관계 |
0<r<0.3 | 거의 상관 없음 |
r=0 | 상관관계(선형,직선)이 존재하지 않음 |
2) 상관분석 유형
피어슨 | 스피어만 | |
개념 | 등간척도로 측정된 두 변수 간의 관계 | 서열척도인 두 변수 간의 관계 |
특징 | 연속형변수, 정규성 가정 | 순서형변수, 비모수적 방법 순위를 기준으로 상관관계 측정 |
'ADsP > 3과목' 카테고리의 다른 글
[3과목] 3-4.통계분석 (4) 시계열분석 (0) | 2022.10.01 |
---|---|
[3과목] 3-4. 통계분석 (3) 회귀분석 (0) | 2022.10.01 |
[3과목] 3-4. 통계분석 (1)통계분석 이해 (1) | 2022.09.25 |
[3과목] 3-3.데이터 마트 (2) 데이터 가공&관리 (0) | 2022.09.21 |
[3과목] 3-3. 데이터마트 (2) | 2022.09.19 |