ADsP/3과목

[3과목] 3-4. 통계분석 (2) 기초통계분석

RECORD WHO (레코드후) 2022. 10. 1. 20:23

(1) 통계분석이해 

 

[3과목] 3-4. 통계분석 (1)통계분석 이해

1절. 통계분석의 이해 1. 통계란? - 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현 2. 통계 자료의 획득 방법 1) 총조사/ 전수조사 census - 대상 집단 모두를

jjou-adblog.tistory.com


 

1. 기술통계 : 자료의 특성을 표, 그림 등을 사용해 정리/요약하는 것 

1) 통계량에 의한 자료 정리

① 중심 위치의 측도 : 표본평균, 중앙값, 최빈값

② 산포의 측도: 분산, 표준편차, 사분위수범위 등

③ 분포의 형태에 관한 측도 

    c-1. 왜도 : 분포의 비대칭 정도를 나타내는 측도 

   c-2. 첨도 : 분포의 중심에서 뾰족한 정도

 

2) 그래프를 이용한 자료 정리 

① 막대그래프 vs 히스토그램

막대그래프 히스토그램
범주형으로 구분된 데이터 (직업, 종교, 음식 등)
범주 순서 의도에 따라 변경 가능
그래프 가로줄 데이터 사이에 공간 존재
연속형으로 표시된 데이터 (몸무게, 성적, 연봉 등) 
임의로 순서 변경 불가
그래프 상 막대 사이 간격이 없음 

② 줄기-잎 그림 (stem-and leaf plot) : 데이터를 줄기와 잎의 모양으로 그린 그림 

③ 상자그림 (box plot) : 다섯 숫자 요약을 통해 그림으로 표현 

 - 이상치 구하는 공식 : Q1-(1.5*IQR) // Q3+(1.5*IQR)

 

2. 상관분석 

1) 정의

- 두 변수 간의 상관 정도(방향성, 밀접도 등)을 알아보기 위한 분석방법

- 상관계수를 통해 인과관계, 분산은 알 수 없음 

- 상관계수 값은 항상 -1과 1 사이에 존재 

0.7<r<1  강한 양/음의 상관관계
0.3<r<0.7 약한 양/음의 상관관계
0<r<0.3 거의 상관 없음
r=0 상관관계(선형,직선)이 존재하지 않음

 

2) 상관분석 유형

  피어슨 스피어만
개념 등간척도로 측정된 두 변수 간의 관계 서열척도인 두 변수 간의 관계
특징 연속형변수, 정규성 가정 순서형변수, 비모수적 방법
순위를 기준으로 상관관계 측정