본문 바로가기
데이터 꿀팁

통계분석의 이해와 통계자료 획득 방법

by 아르지아 2023. 4. 29.

통계

  • 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현이다.
    예시) 일기예보, 물가/실험률/GNP, 정당 지지도, 의식조사와 사회조사 분석 통계, 임상실험 등의 실험 결과 분석 통계
  • 조사 또는 실험을 통해 데이터를 확보, 조사 대상에 따라 총조사와 표본조사로 구분된다.

 

통계자료의 획득 방법

총 조사/전수 조사

  • 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로 특별한 경우를 제외하고는 사용되지 않는다.

표본조사

  • 대부분의 설문조사가 표본조사로 진행되며 모집단에서 샘플을 추출하여 진행하는 조사이다
  • 모집단 : 조사하고자 하는 대상 집단 전체
  • 원소 : 모집단을 구상하는 개체
  • 표본 : 조사하기 위해 추출한 모집단의 일부 원소
  • 모수 : 표본 관측에 의해 구하고자 하는 모집단에 대한 정보
  • 모집단의 정의, 표본의 크기, 조사 방법, 조사 기간, 표본추출 방법을 정확히 명시해야 한다.

표본 추출 방법

  • 표본조사의 중요한 점은 모집단을 대표할 수 있는 표본 추출이므로 표분 추출 방법에 따라 분석 결과의 해석은 큰 차이가 발생한다.
  • 단순랜덤 추출법 : 각 샘플에 번호를 부여하여 임의의 n개를 추출하는 방법으로 각 샘플은 선택될 확률이 동일하다.
  • 계동추출법 : 단순 랜덤 추출법의 변형된 방식으로 번호를 부여한 샘플을 나열하여 K개씩 n개의 구간으로 나누고 첫 구간에서 하나를 임의로 선택한 후에 K개씩 찍어서 n개의 표본을 선택한다. 즉, 임의 위치에서 매 k번째 항목을 추출하는 방법이다.
  • 집략추출법 : 군집을 구분하고 군집별로 단순랜덤 추출법을 수행한 후, 모든 자료를 활용하거나 샘플링하는 방법이다.
  • 중화추출법 : 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법으로 유사한 원소끼리 몇 개의 층으로 나누어 각 층에서 랜덤 추출하는 방법이다.

측정

  • 표본조사나 실험을 실시하는 과정에서 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하도록 관측해 자료를 얻는 것이다.
  • 명목 척도 : 측정 대상이 어느 집단에 속하는지 분류할 때 사용
  • 순서 척도 : 측정 대상의 서열 관계를 관측하는 척도
  • 구간 척도 : 측정 대상이 갖고 있는 속성의 양을 측정하는 것으로 구간이나 구간 사이의 간격이 의미가 있는 자료
  • 비율 척도 : 간격에 대한 비율이 의미를 가지는 자료, 절대적 기준인 0이 존재하고 사칙연산이 가능하며 제일 많은 정보를 가지는 척도

 

통계 분석

정의

  • 특정한 집단이나 불확실한 현상을 대상으로 자료를 수집해 대상 집단에 대한 정보를 구하고, 적절한 통계분석 방법을 이용해 의사결정을 하는 과정이다.

기술 통계

  • 주어진 자료로부터 어떠한 판단이나 예측과 같은 주관이 섞일 수 있는 과정을 배제하여 통계집단들의 여러 특성을 수량화하여 객관적인 데이터로 나타내는 통계분석 방법론이다.
  • 샘플에 대한 특성인 평균, 표준편차, 중위수, 최빈값, 그래프, 왜도, 첨도 등을 구하는 것을 의미한다.

통계적 추론

  • 수집된 자료를 이용해 대상 집단에 대한 의사결정을 하는 것으로 샘플을 통해 모집단을 추정하는 것을 의미한다.
  • 모수 추정 : 표본집단으로부터 모집단의 특성인 모수(평균, 분산 등)를 분석하여 모집단을 추론한다.
  • 가설 검정 : 대상 집단에 대해 특정한 가설을 설정한 후에 그 가설이 옳은지 그른지에 대한 채택 여부를 결정하는 방법론이다.
  • 예측 : 미래의 불확실성을 해결해 효율적인 의사결정을 하기 위해 활용한다.

 

댓글