[통계] 초보자들을 위한 통계 용어 한줄 정리

기술통계학부터 포아송분포까지 기본적인 통계학 용어들을 한 줄로 정리해보았다.

초보자들을 위해 정말 간단히 정리한 것이니 깊은 설명은 다른 글을 참조하길 바란다! 


  1. 기술통계학 - 데이터를 요약하고 설명하는 통계학의 한 분야, 평균이나 중위수 같은 대표값을 찾거나 데이터가 얼마나 퍼져 있는지를 보여주는 것이 포함된다.
  2. 모집단 - 연구나 분석의 대상이 되는 전체 집단을 의미한다.
  3. 표본 - 모집단에서 선택된 일부분이다. 모집단 전체를 조사하는 것이 불가능할 때 표본을 통해 모집단에 대한 추론을 진행한다.
  4. 데이터 - 관찰이나 실험을 통해 수집된 정보의 집합, 데이터는 숫자, 단어, 측정값 등 다양한 형태가 있다.
  5. 모수와 통계량 - 모수는 모집단의 특성(예: 모집단의 평균)을 나타내는 값이고 통계량은 표본의 특성(예: 표본의 평균)을 나타내는 값이다.
  6. 산술평균 - 모든 데이터를 더하고, 데이터의 개수로 나눈 값이다. 일반적으로 '평균'이라고 하면 산술평균을 의미한다.
  7. 중위수 - 데이터를 크기 순으로 나열했을 때, 정확히 중간에 위치하는 값, 데이터의 개수가 짝수일 경우 가운데 두 수의 평균을 사용한다.
  8. 최빈수 - 데이터 중 가장 많이 나타나는 값이다. 데이터에 따라 최빈수가 없거나 여러 개일 수도 있다.
  9. 미드레인지 - 최대값과 최소값의 평균을 의미한다. 데이터의 범위를 대표하는 한 방법이다.
  10. 범위 - 최대값과 최소값의 차이, 데이터가 얼마나 퍼져 있는지를 나타내는 한 방법이다.
  11. 분산 - 데이터가 평균으로부터 얼마나 멀리 떨어져 있는지를 나타내는 값이다. 데이터의 퍼짐 정도를 수치화한다.
  12. 표준편차 - 분산의 제곱근으로 데이터가 평균으로부터 얼마나 멀리 분포하는지를 나타내는 값이다.
  13. 변동계수 - 표준편차를 평균으로 나눈 값으로 데이터의 상대적인 변동 정도를 나타낸다.
  14. 상자-수염 그림 - 데이터의 분포를 시각적으로 표현한 그림으로, 중위수, 사분위수, 최대값, 최소값 등을 한눈에 볼 수 있다.
  15. 왜도 - 데이터의 분포가 양쪽으로 얼마나 치우쳐 있는지를 나타내는 척도이다.
  16. 첨도 - 데이터 분포의 뾰족한 정도를 나타내며, 정규분포와 비교했을 때의 상대적인 뾰족함을 측정한다.
  17. 표준오차 - 표본평균의 변동성을 나타내는 값으로, 모평균을 추정할 때의 불확실성을 측정한다.
  18. 확률변수 - 확률 실험의 결과에 따라 값이 결정되는 변수입니다. 예를 들어, 동전 던지기의 결과는 확률변수가 될 수 있다.
  19. 확률분포 - 확률변수가 특정 값을 가질 확률을 나타내는 분포입니다. 확률변수의 모든 가능한 값과 그 값이 나타날 확률을 설명한다.
  20. 정규분포 - 자연 현상이나 사회 현상에서 흔히 발견되는 종 모양의 분포를 가진 확률분포이다.
  21. 표준정규분포 - 평균이 0이고 표준편차가 1인 정규분포, 다양한 정규분포를 표준화하여 비교 가능하게 한다.
  22. 이항분포 - 고정된 횟수의 독립된 시행에서 성공 또는 실패의 결과를 나타내는 분포이다.
  23. 포아송분포 - 주어진 시간 또는 공간에서 발생하는 사건의 횟수를 나타내는 분포로 사건이 드물게 발생할 때 사용된다.