You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

R语言多变量图中对角线曲线的含义解读求助

R语言多变量图中对角线曲线的含义解读求助

嘿,我猜你应该是用了类似GGally::ggpairs()这类进阶的配对图工具吧?普通的基础pairs()函数对角线默认是直方图,但像GGally这类包的配对图,对角线位置默认展示的是变量的核密度曲线(概率密度曲线),而不是你以为的变量自相关散点图~

你之前觉得应该是y=x直线,那是变量和自身做散点图的结果,但这类配对图工具为了让整个图的信息量更足,会把对角线位置换成单个变量的分布曲线——它的作用是展示这个变量本身的数据分布特征:比如“可用烤箱数”这条曲线,能告诉你大部分天数里可用烤箱数集中在哪个区间,数据有没有偏态、峰值在哪里,这些信息比一条单调的直线有用多了。

再结合你已经理解的其他区域:右上角的变量相关系数、左下角的变量间散点图,整个配对图就形成了一套完整的分析视角——既看变量之间的关联,也看每个变量自身的分布情况,是不是一下子就明白啦?

备注:内容来源于stack exchange,提问作者RandomGuy57

火山引擎 最新活动