코스피지수와 소비심리지수는 서로 관계가 있다고?:1일1글쓰기-2023.01.07.
본문 바로가기
글쓰기/책리뷰

코스피지수와 소비심리지수는 서로 관계가 있다고?:1일1글쓰기-2023.01.07.

by 찐콕 2023. 1. 7.

코스피지수와 소비심리지수 상관관계 분석

[부자 만드는 경제기사] - 저자:이상건, 노혜령-

 

어제 코스피지수와 소비심리지수의 산점도를 그려보았다.

어제는 어떤건지도 모르고 그렸는데 오늘 확인해 보니 저 상관계수가 피어슨 상관분석의 상관 계수 값과 같았다.

 

그래서 산점도 그래프의 값이 피어슨 상관분석을 default 설정(기본값)하고 있다는 것이 느껴졌다.

그렇다면 다른 상관분석의 산점도도 그릴 수 있을거라는  생각에 해당 패키지의 내용을 검색하였다.

 

 키워드로 본 핵심

  • 피어슨상 관분석 R과 psych 패키지 활용
  • 스피어만 상관분석 R과 psych 패키지 활용
  • 켄달 상관분석 R과 psych 패키지 활용

1. PerformanceAnalytics package manual

(https://cran.r-project.org/web/packages/PerformanceAnalytics/PerformanceAnalytics.pdf)

 

페이지 49에 보면 Usage가 나오고 거기에 method라는 항목을 사용할 수 있다는 것을 알게 되었다.

그렇다면 스피어만과 켄달의 상관분석 산점도도 그려봐야겠다.

 

2. 피어슨 상관분석 산점도

library(PerformanceAnalytics)
chart.Correlation(kospi,histogram =T,pch=19)

피어슨 상관분석 산점도-소비자심리지수&코스피지수

위의 산점도를 보면 소비자심리지수와 코스피지수는 상관관계가 높다고 볼 수 없다.

상관계수가 0.18이라는 것은 아예 상관이 없는 0은 아닌데 그렇다고 상관정도가 높은 1도 아니다.

관계는 있는거 같은데 끈끈하다고 보기에는 애매한 수치이다.

그렇다면 더 정확하게 p-value 값을 확인해 보아야 한다.

 

3. Psych package manual (https://cran.r-project.org/web/packages/psych/psych.pdf)

 

R에 기본 내장된 함수와 Psych 패키지를 활용하면 상관분석의 p-value 값을 확인할 수 있다.

 

R 내장된 함수

cor.test(kospi$소비자심리지수,kospi$코스피지수,method="pearson")

cor.test

Psych package 활용

install.packages(psych)
library(psych)
corr.test(kospi,use="complete",method="pearson",adjust="none")

psych pearson corr.test

use의 complete는 결측치를 제거하고 데이터를 활용한다. adjust는 조정을 할 것인지를 나타내는 것으로 자세한 것은 매뉴얼을 참고바란다.

 

R 내장 코드의 경우 P-value 갑싱 0.16이고 psych package의 경우 P-value 값이 0.02이다.(p-value: 0.05 이하)

즉 귀무가설( 코스피지수와 소비자심리지수에는 관련성이 없다)는 내용을 기각할 정도이다.

 

그러니 p-value로 보면 코스피지수와 소비자심리지수에는 증가할 때는 같이 증가하고 떨어질 때는 같이 떨어지는 양의 관계가 있다는 것이 확인된다. 

 

그렇다면 나머지 스피어만 상관분석과 켄달 상관분석에서는 어떨까?

스피어만과 켄달의 경우 순위를 매겨서 상관분석을 하는 것이라고 들었다.

 

4. 스피어만 상관분석

chart.Correlation(kospi,histogram=T,method=c("spearman"),pch=19)

스피어만 상관분석 산점도 -코스피지수와 소비자심리지수

 

R 내장된 함수

cor.test(kospi$소비자심리지수,kospi$코스피지수,method="spearman")

cor.test-spearman

 

Psych package 활용

library(psych)
corr.test(kospi,use="complete",method="spearman",adjust="none")

psych corr.test-spearman

 

 스피어만 상관계수가 0.0017로 피어슨보다 더 낮은 양의 상관관계가 있지만 둘 다 p-value값이 0.98이므로 p-value값이 귀무가설을 기각하지 못한다. 그러므로 코스피지수와 소비자심리지수에는 상관관계가 없다는 결론이 나온다.

 

5. 켄달 상관분석

그렇다면 켄달 분석의 경우는 어떨까?

chart.Correlation(kospi,histogram=T,method=c("kendall"),pch=19)

켄달상관분석 산점도- 코스피와 소비자심리지수

 

 

 

R 내장된 함수

cor.test(kospi$소비자심리지수,kospi$코스피지수,method="kendall")

r -cor.test- kendall

 

Psych package 활용

library(psych)
corr.test(kospi,use="complete",method="kendall",adjust="none")

psych - corr.test. kendall

켄달의 상관계수는 R의 cor.test에서는 -0.0046이 나왔고 psych의 corr.test에[서는 0이 나왔다. p-value는 R에서는 0.9278이 나왔고 psych에서는 0.95가 나왔다. 켄달의 상관분석 방법은 조금 차이가 있었다.

원인은 통계패키지별로 계산방법이 다르니 차이가 있을 수 있다는 정도로 유추가 가능하다.

 

그렇다면 피어슨, 스피어만, 켄달의 통계분석 중 유의미한 내용이 있었을까?

그나마 활용한다면 p-value값이 유의한 간격/비율척도로 측정된 상관관계 분석인 피어슨 상관분석이다. 

피어슨 상관분석은 연속형 데이터, 스피어만과 켄달의 경우 서열척도로 측정된 데이터 분석에 이용한다.

 

상관분석에 관한 기초 내용을 확인한 곳이다.

https://blog.naver.com/PostView.nhn?blogId=y4769&logNo=220227007641 

 

[SPSS 22] 상관분석(Correlation Analysis)

매우 오랜만에 블로그에 SPSS 통계 포스팅을 한다. 지금까지 바쁘다는 핑계로 미루어 왔는데 마침 오늘...

blog.naver.com

코스피지수와 소비자심리지수는 연속형 데이터므로 피어슨 상관분석이 적당하다.

그럼에도 나머지 분석을 해본 것은 상관분석에 사용되는 다른 기법도 궁금했으며 같은 값이 나올까?라는 호기심이 컸다.

결론은 같은 값은 안나오며 서열척도로 측정된 데이터 분석에 활용한다는 스피어만과 켄달도 다른 수치가 나왔다. 아마 이용하는 계산식이 다르지 않을까 조심스럽게 추측해본다.

 

정리
  • 코스피지수와 소비자심리지수 사이에는 양의 관계( 코스피지수 ↑, 소비자심리지수 ↑)
  • 코스피지수와 소비자심리지수 상관관계 0.18

 

 

그렇다고 저 통계를 어디에 쓸만할까? 생각해보면 모르겠다. 선행으로 알 수 있는 지수는 아니기에 분석하는데 의의를 두고 했다.

 

728x90

댓글