请问如何理解方差分析中的R-sq值?
在minitab14版中,方差分析会给出一个R-sq值,该值的计算应该是SSA/SST得到的一个数值。但是这个值有什么样的指导意义呢?
我做了一个one way ANOVA,发现P值是<0.05的,即我的factor之间是有显著性差异的,但是我发现R-sq只有4%,也就是说R-sq=SSA/SST=4%,换个说法就是组间差异只占总SST的4%,而组内差异占了96%。
这样能否判定特性Y的差异有96%是来自组内差异呢? 即使我要对该特性Y进行改善,如果只改善组间差异,那么我只能够改善的空间也只有4%?
另外一个角度,我做的该方差分析的factor是有显著性差异的,P<0.05,而在检验过程中,F值是 F=MSA/MSE得到的。这样是否已经比较过组间/组内差异得到的结论?
但是为何和R-sq得到的结论会有不一样?
请各位大师指点。
如图:
[[i] 本帖最后由 six_sigma_Alex 于 2005-7-26 19:45 编辑 [/i]] [quote]原帖由 [i]six_sigma_Alex[/i] 于 2005-7-25 12:41 发表
在minitab14版中,方差分析会给出一个R-sq值,该值的计算应该是SSA/SST得到的一个数值。
但是这个值有什么样的指导意义呢?
我做了一个one way ANOVA,发现P值是<0.05的,即我的factor之间是有显著性差异的, ... [/quote]
大师们赐教啊~~ [quote]原帖由 [i]six_sigma_Alex[/i] 于 2005-7-25 12:41 发表
在minitab14版中,方差分析会给出一个R-sq值,该值的计算应该是SSA/SST得到的一个数值。
但是这个值有什么样的指导意义呢?
我做了一个one way ANOVA,发现P值是<0.05的,即我的factor之间是有显著性差异的, ... [/quote]
为什么没有人帮忙解答一下呢? R2 (R-sq)
Coefficient of determination; indicates how much variation in the response is explained by the model. The higher the R2 , the better the model fits your data. The formula is:
SS Error
1- -----------------
SS Total 好象区分群内和群件变动的比例是依靠F值吧?? R-sq=R-squre 即R的平方,该值为相关系数,越大表示数据的相关性越强,可以对相关的两个变量建立回归直线方程,R-sq越大则求出的回归方程的对数据的代表性越好,该值最大为1,最小为0,越接近1相关性越好。 [quote]原帖由 [i]charlesy[/i] 于 2005-7-26 13:58 发表
R-sq=R-squre 即R的平方,该值为相关系数,越大表示数据的相关性越强,可以对相关的两个变量建立回归直线方程,R-sq越大则求出的回归方程的对数据的代表性越好,该值最大为1,最小为0,越接近1相关性越好。 [/quote]
方差分析中的因子A和Y之间如何建立回归直线方程?两者的自由度相差太大了啊。
[[i] 本帖最后由 six_sigma_Alex 于 2005-7-26 19:45 编辑 [/i]] [quote]原帖由 [i]aiyinsitan[/i] 于 2005-7-26 13:18 发表
R2 (R-sq)
Coefficient of determination; indicates how much variation in the response is explained by the model. The higher the R2 , the better the model fits your data. The formula is:
... [/quote]
请参看我的图,P值和F值反映我的机台之间是有显著差异的。
但是R-sq非常小。
那么这里的R-sq表示一个什么意思呢? 我簡單的回覆一下
他的概念是用來判斷所有因子所造成的變異
佔全部變異多少百分比
以你的例子來說,總變異平方和約略是0.0075615,但機台差異所造成的變異只佔了其中2.35%,也就是說:壓後厚度的變異,其造成的原因應該還有其他因素才對 同意楼上的说法,r-sq在回归分析中是可解释的变异!
R-sq
回复:请问如何理解方差分析中的R-sq值?
R2 (R-sq)
Coefficient of determination; 决定系数,在Minitab中,R-sq = 1-SSE/SST R-sq adj=1-[SSE(n-k-1)/SST(n-1)] 公式会让人看晕,但是就R-sq/R-sq adj 来讲, 值越小,ANOVA table 的可信度就越差。
举例:你的ANOVA table 中可以这样解释: Pvalue=0.02<0.05,压后厚度和机台号有明显的关系,但是 R-sq=2.35% ,那么这个决定将会有(1-2.35%)=97.65% 的错误。 你的目的是什么?
你做的是单因子3水平的ANOVA分析,显然3台机台加工的厚度均值存在显著差异,后续就应该把不适合生产的机台进行分析。你非要在厚度和这3个机台之间产生线性关系,那显然是不切实际的,所谓Regression是针对因子而非对水平! [quote]原帖由 [i]Jessica081121[/i] 于 2005-8-2 13:56 发表
回复:
请问如何理解方差分析中的R-sq值?
R2 (R-sq)
Coefficient of determination; 决定系数,在Minitab中,R-sq = 1-SSE/SST R-sq adj=1-[SSE(n-k-1)/SST(n-1)] 公式会让人看晕,但是就R-sq/R-sq adj 来讲 ... [/quote]
在此例中,我認為是還有太多「干擾因素」
所以雖然有明顯差異,但是卻不足以參考 [quote]原帖由 [i]six_sigma_Alex[/i] 于 2005-7-25 12:41 发表
在minitab14版中,方差分析会给出一个R-sq值,该值的计算应该是SSA/SST得到的一个数值。
但是这个值有什么样的指导意义呢?
我做了一个one way ANOVA,发现P值是<0.05的,即我的factor之间是有显著性差异的, ... [/quote]
这个问题很有意思. 我看了楼主的MINITAB分析,拙见如下:
1.三个机台的输出值是存在显著不同的.
2.R-SQ不能作为ANOVA中来判断显著与否的标准.
3.在这里R-SQ代表什么呢?我觉得只是个参考. 本来机台本身就不能看作有序列的自变量. 如果硬去假设机台是1,2,3个水平的话, 你的回归模型的R-SQ大约就是这个数. 为什么说是大概呢?因为如果你做回归分析的话, ANOVA就会认为机台是一个因素,自由度就变成1了.但是R-SQ应该和回归分析的R-SQ接近.但是要注意:你在做回归分析的时候要根据大小排序.
4.既然存在显著性差异,R-SQ为什么很小呢?因为如果从回归的角度而言,确实机台作为一个因素对输出结果的影响太小了.但是这并不能妨碍ANOVA对不同机台之间的判断.因为SS的差异很大, 但是MS却是要除以自由度的, 除过自由度的MS才能看出组间的真正变异.
而三个机台之间,只有一个和其他有显著不同, 从回归的角度看,肯定会线性不好.而且子组的样本似乎太大了.包含的因素很多,当然就显得机台这个因素的影响更小了.
所以R-SQ,就是模型中可解释方差的比例. 讲得太好了, 好学习
页:
[1]
