我有一批数据,之前用spss等做过相关性分析,现在急需拟合出其中的关系,但是遇到了很多问题,真诚求助.
虽然该问题不直接是经济类的,但是个人认为数据挖掘的机理和技巧是相通的,好的数据分析方法可以引用发挥。
背景:因变量;大气能见度
自变量:湿度、PM2.5浓度、风速、雨量、日照 等10项为影响因变量的。
已知:部分自变量与大气能见度有较好相关性,前三个都能达到0.5左右,它们之间也相互影响。
用excel拟合湿度、PM2.5与能见度的曲线时,基本是幂函数相对较好,但是R值不理想,最好的仅是0.6。大部分时候是0.2-0.3
求问:1 我的能见度与湿度等均是海量数据,什么样的方法更适合挖掘出其中的关系呢?分类?
2,我想用matlab拟合一个二元回归公式,湿度、PM2.5浓度做自变,但这种背景下,这样的拟合思路对吗?
3 如果这样简单的拟合方法不合适,尝试怎样的方法才能找到自变量与因变量的数值关系呢,进一步才能预报因变量走势??想主要用matlab做分析工具
附件中是做出的excel数据对比图,本文下面也附有
[img=787,179]file:///C:/Documents%20and%20Settings/Administrator/Application%20Data/Tencent/Users/313448636/QQ/WinTemp/RichOle/0R6~MS~74@~(L%601UT1TE@_I.jpg[/img] [img=814,185]file:///C:/Documents%20and%20Settings/Administrator/Application%20Data/Tencent/Users/313448636/QQ/WinTemp/RichOle/C_)$[(_(85U1[[3]B_V8_(N.jpg[/img]