清明风雨 发表于 2016-6-14 20:37
非常感谢讨论!
嗯,命名上我确实没写清楚,应该要写salary.m 跟 salary.f。我的上个回复忘说了,男女工 ...
"paired samples test资料的时候看到它的结果里需要分析两个样本是否有相关关系来确定样本是否适用于paired samples test"...
---> 這倒不一定
paired sample t test 跟 correlation 沒有絕對關係
譬如說 有六組配對資料 說 夫妻好了
六個丈夫的分數是 1 2 3 4 5 6 他們太太的分數分別是 6 5 4 3 2 1
這一組資料是完全負相關 (r = -1) 但是 這個 paired sample t test 的 t 值會是 0
另一種情況
六個丈夫的分數是 3 3 3 4 4 4 他們太太的分數分別是 5 6 7 4 6 8
這個相關會是 0 但是 paired sample test 會顯著
您那樣重排資料的問題在於 為什麼 21450 要跟 57000 配對(第一組)
為什麼不可以是 21450 跟 40200 配?
他們沒有關係啊
不若 丈夫A 一定得要跟 太太 A 配對
而事實上 你把第二列的前兩個數值 57000 跟 40200 互換位置 整個相關係數就會不一樣
是不是 pair 還是 independent sample 要看實驗設計 不是看相關係數的顯著性
回到統計問題的本質
correlation 看的是兩組分數是不是共變
t test 看的是 這兩組分數有沒有差異
^﹍^