데이터 한 그릇

기초통계3 : 그래프와 표를 이용한 기술통계학 기법 (ⅱ- 1) 본문

통계/기초통계

기초통계3 : 그래프와 표를 이용한 기술통계학 기법 (ⅱ- 1)

장사이언스 2021. 2. 28. 15:03

 

  • 투자수익률과 히스토그램
  • 두 구간변수의 그래프 기법

https://kurt7191.tistory.com/5?category=1000998

 

기초통계3 : 그래프와 표를 이용한 기술통계학 기법 (ⅱ)

구간데이터의 그래프 기법 히스토그램 계급구간의 수와 간격의 크기 히스토그램의 모습 https://kurt7191.tistory.com/4 기초통계2 : 그래프와 표를 이용한 기술통계학 기법(ⅰ) 기술통계학 기법 데이터

kurt7191.tistory.com


투자수익률과 히스토그램

 

  앞선 장에서는 데이터의 유형이 구간데이터일 때 히스토그램 그래프가 사용됨을 살펴보았다. 또한 히스토그램의 계급 구간의 수와 계급 구간의 간격을 구하는 방법도 살펴보았다. 그리고 히스토그램의 다양한 모습에 대해서도 살펴보았다. 이번 장에서는 앞서 배운 히스토그램을 이용하여 투자수익률에 대해서 살펴볼 예정이다.(켈러의 경영경제통계학 62pg 문제)

 

1)투자수익률

 

  투자수익률(return on invest-ment)은 이득을 투자금액으로 나누어서 계산한다. 예를들어서 현재 100달러를 투자하고 1년후에 투자금액의 가치가 106달러가 된다면 6달러 이득을 본 것으로써  6%의 투자수익률을 가진다고 볼 수 있다. 양의 투자수익률이 있듯이 음의 투자수익률을 보일 수도 있다. 앞선 예에서 100달러를 투자했지만 1년후에 투자금액이 80달러의 가치를 가진다면 20달러의 손해를 본것으로 -20%의 투자수익률을 보인다.

 

  투자자는 투자수익률을 고려하여 투자를 해야만 한다. 투자자에게 있어서 최고의 투자란, 투자수익률이 높으면서 투자의 위험은 낮은 것이다. 

 

2)투자수익률과 히스토그램

 

  히스토그램을 이용하면 투자의 위험도와 투자의 기대되는 수익률을 알아볼 수 있다. 히스토그램의 중심 위치는 기대되는 투자의 수익률을 나타내며, 히스토그램의 분산은 투자의 위험에 관한 정보를 나타낸다. 만일 분산이 거의 없다면 투자를 했을 때 나타나는 결과가 예측 가능하기 쉬워질 것이며 분산이 크다면 투자를 했을 때 어떤 결과를 도출할지 예측하기가 어려워질 것이다. 밑의 그림은 두 개의 투자에 관련된 히스토그램을 나타낸다.

 

 

  A와 B의 히스토그램을 비교해보면, A의 분산이 B의 분산보다 더 낮음을 알 수 있다. 그렇다면 투자자가 투자를 했을 때 예측되는 투자 결과는 B보다 A가 더 예측하기 쉬움을 알 수 있다. 따라서 투자의 위험도는 B보다 A가 더 낮음을 알 수 있다. 중심값의 크기를 비교해 보면 B가 A보다 높음을 알 수 있다. 따라서 기대되는 투자 수익률은 B가 더 높음을 알 수 있다. 종합해보면 A가 B보다 투자 수익률은 낮고, A가 B보다 안정성은 높음을 알 수 있다. 따라서 투자자는 A 투자를 더 선호할 것을 알 수 있다.

 

  히스토그램의 해석은 어느 정도 주관적이다. 이러한 경우 수치지표 기법이 그래프에서 부족한 상세하고 정확한 정보를 제공한다.


두 구간변수의 그래프 기법

  앞서 살펴본 구간데이터의 그래프 기법인 히스토그램은 하나의 변수를 이용한 그래프 기법이다. 만일 구간데이터가 두 개 존재한다면 그래프 기법은 달라진다. 바로 '산포도' 이다. 산포도는 두 변수의 관계를 살펴보기에 적합한 그래프이다. 하나의 변수를 '독립변수' 라고 부르며 다른 하나의 변수를 '종속변수' 라고 부른다. 독립변수의 변화가 종속변수에 어느 정도 영향을 끼치는지 산포도 그래프를 통해서 나타낼 수 있다.

 

출처 : https://m.blog.naver.com/PostView.nhn?blogId=ljh0326s&logNo=220990213857&proxyReferer=https:%2F%2Fwww.google.com%2F

 

 

  산포도의 모습을 통해서 선형관계와 선형관계의 강도를 알아볼 수 있다. 이를 알아보기 위해서는 산포도의 점들 사이를 통과하는 직선을 그려야만 한다. 만일 점들이 이 직선 주변에 모여 있다면 선형관계(Linear relationship)가 존재한다고 할 수 있다. 만일 이 직선이 양의 방향으로 그려져 있다면(한 변수가 증가할 때 다른 변수도 비례적으로 증가) 양의 선형관계라고 칭하며 직선이 음의 방향으로 그려져 있다면(한 변수가 증가할 때 다른 반수는 반비례함) 음의 선형관계라고 칭한다.

 

  그렇다면 질문이 있을 수 있다. 산포도 사이를 지나가는 직선은 어떻게 그어야 하는지 의문이 생길 수 있다. 통계학자들은 직선을 그리는 한 가지 객관적인 방법을 고안해 냈는데 바로 최소자승법(least squares method)이다. 최소자승법을 활용한 통계 기법은 뒤의 장에서 더 자세히 살펴보도록 하자.


정리

  지금까지 히스토그램을 이용하여 투자수익률과 투자 위험도에 대해서 살펴보았다. 만일 히스토그램의 분산이 크다면 투자의 위험도가 높음을 살펴보았으며 히스토그램의 중간 값이 크다면 기대되는 투자 수익률이 높음을 살펴보았다. 마지막으로 구간데이터가 두 개일 경우의 그래프 기법에 대해서 살펴보았다. 구간데이터가 두 개일 경우 두 데이터의 관계를 살펴볼 수 있는 산포도 그래프를 사용함을 살펴보았다. 산포도를 통해서 두 변수에 선형관계가 존재하는지를 살펴봐야 하며, 만일 선형관계가 존재한다면 음의 선형관계인지 양의 선형관계인지 살펴봐야한다. 또한 선형관계가 존재하는지 알아보기 위해서는 산포도의 점들을 지나는 선을 그어야 하는데, 그 선을 긋는 법을 통계학자들이 '최소자승법' 이라는 객관적인 방법을 만들었음을 알아보았다. 

  지금까지는 데이터의 유형에 따른 그래프 기법을 알아보았는데 다음장 부터는 기술통계학의 수치 기법에 대해서 살펴보겠다.

 

 

Comments