前面介绍了如何利用PowerBI进行相关性分析,如果你还没有看过这篇文章,请先点击下面的链接查看:
有专门的DAX函数,Power BI如何进行相关性分析?
在这篇文章是用的常规DAX函数来计算的相关系数,里面说到没有专门的DAX函数,其实不太准确,还是有个函数可以直接计算相关系数的。
这个函数就是LINESTX,关于它的基本用法,昨天介绍回归分析时已经介绍过:Power BI如何搞定回归分析?原来还有这个强大的DAX函数
LINESTX返回的表,是按最小二乘法进行回归分析的各种信息,除了斜率和截距,还包括其他指标,具体来说,这个表包含有以下统计信息:
SlopeN :斜率,每个自变量一个
Intercept:截距
StandardErrorSlopeN:斜率标准误差,每个自变量一个
StandardErrorIntercept:截距标准误差
CoefficientOfDetermination:决定系数
StandardError:标准误差
FStatistic:F统计量
DegreesOfFreedom:自由度
RegressionSumOfSquares:回归平方和
ResidualSumOfSquares:残差平方和
如果有统计学背景,对这些指标应该都不陌生,如果没有相关背景,也不用刻意去记,需要用到的时候去搜索一下相关知识了解即可。
其中CoefficientOfDetermination,也就是决定系数,就是我们之前计算的相关系数(Correlation Coefficient)的平方,只需要从LINESTX返回的表中提取这个指标,开平方根,就可以得到相关系数。
仍以前面文章中的数据为例,LINESTX返回的表如下:

这里面就是最小二乘法回归分析的各种统计指标,其中CoefficientOfDetermination的值为0.7651,它就是相关系数的平方,我们可以直接写度量值提取决定系数并进行开方,来得到相关系数:
相关系数 =
SQRT(
SELECTCOLUMNS(
LINESTX('表','表'[利润额],'表'[营销费用]),
"决定系数",[CoefficientOfDetermination]
)
)
这个度量值的逻辑与前面我们介绍回归分析时,计算斜率和截距的思路一样,只是多了个开方运算,这里不再重复介绍。它的计算结果与之前用常规DAX函数的结果完全一致:

以后再需要计算相关系数时,建议用这种方式,相比之前的写法要简单很多,看起来也更加优雅。
PowerBI星球的最新版内容合辑,值得你收藏学习:
.