统计自由度是什么意思(t分布的自由度是什么)

什么是自由度(什么是统计学中的自由度?之前,一位读者问我是否可以试着解释统计学中自由的含义。从那以后,我一直在想,因为这个要求非常谨慎,就像某种野兽,我不确定我是否能安全地把它击倒。自由不容易解释,它们出现在统计学中一些高级而复杂的情况下。在数学上,它们在技术上被定义为随机向量场的维数。但是我们不会谈论这个,因为自由通常不是你进行统计分析所需要知道的,除非你

什么是自由度(什么是统计学中的自由度?之前,一位读者问我是否可以试着解释统计学中自由的含义。从那以后,我一直在想,因为这个要求非常谨慎,就像某种野兽,我不确定我是否能安全地把它击倒。自由不容易解释,它们出现在统计学中一些高级而复杂的情况下。在数学上,它们在技术上被定义为随机向量场的维数。

但是我们不会谈论这个,因为自由通常不是你进行统计分析所需要知道的,除非你是一个研究统计学家或研究统计理论的人。然而,我真的很想知道,为了冒险和好奇,这里有一些例子来提供一个统计数据的基本观点。不同的自由度首先忘记统计数字,想象你是一个有趣的人,喜欢戴帽子,你不在乎什么是自由,你相信多样性是生活的调味品。不幸的是,你有限制。你只有七顶帽子。然而,你想每天都戴不同的帽子。

第一天,你可以戴7顶帽子中的任何一顶。第二天,你可以从剩下的6顶帽子中选择,第三天,你可以从剩下的5顶帽子中选择,以此类推。在第六天,你有两顶帽子可以从这周没戴过的帽子中选择。但是在你选择帽子的六天后,七天内你就没有帽子可以选择了。你必须戴上剩下的最后一顶帽子。你有7-1=6天的帽子,你可以换你的免费帽子!这是统计学中的自由概念。自由度通常被定义为当“观察”(一条信息)估计统计参数时自由变化的数据量。自由度:单样本T检验现在假设你没有帽子,你进入数据分析。您有10个值的数据集。如果你不估算,你可以取任意数量的值,对吗?每个值都可以完全自由更改。但是如果你想用单样本T检验来检验10个样本的总体平均值,你现在有了一个约束平均估计。这个约束到底是什么?根据定义,必须保持以下关系:数据中所有值的总和必须等于nx的平均值,n是数据集的数量值。如果数据集有10个值,这10个值的总和必须等于平均值x 10。如果10个值的平均值为3.5(您可以选择任何数字),此约束要求10个值的总和必须等于10 x 3.5=35。有了这个约束,数据集的第一个值可以自由更改。对于任何值,所有10个数字值的总和仍然可以是35。第二个值也可以自由改变,因为不管你选择什么值,它仍然允许的可能性总数是35。事实上,前九个值可以是任何值,包括这两个示例:34,-8.3,-37,-92,-1,0,1,-22,99 0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,但它必须是一个特定的数字:34,-8.3,-37,-92,-1,0,1,-22,99-第10个值必须是61.3 0.1,0.2,0不管你使用什么样的样本量,或者你使用的样本的平均值的最后一个值不是自由变化的,你最终得到n- 1个自由度,其中n是样本量。另一种方法是,自由度的数量等于“观测值”的数量减去所需观测值之间的关系(例如,参数估计值)。对于单样本T检验,一个自由度估计平均值,其余n- 1个自由度估计可变性。自由度定义了一个特定的t分布,用于计算t测试p值和t值。

注意,对于小样本(n),有一个小的自由度(单样本t检验对应于n-1),并且t分布有一个胖尾。这是因为t分布是专门设计的,以便在分析小样本时提供更保守的测试结果(例如在葡萄酒行业)。随着样本量(n)的增加,自由度增加,T分布接近正态分布。自由度:卡方检验让我们看另一个方面。卡方检验的独立性用于确定两个分类变量是否相关。对于该测试,自由度是分类变量双向表中在两行和列的边际总数的约束下可以改变的单米数。所以在这种情况下,每个“观察”都是一个人的频率。考虑最简单的例子,一个22的表,有两个类别和每个类别的两个级别。

不管你用什么值,行和列的边际总数。一旦设置了这些值,只能更改一个单米格的值(此处显示的符号可以是四个人中的任何一个)。一旦你输入了一个个体的数目,所有其他个体的数目就是预先的行和列的总数。他们不能自由改变。因此,卡方检验是一个独立自由度为1的22表。类似地,32表格有2个自由度,因为只有两个给定的单米组可以有不同的边缘总数。

如果你尝试使用不同大小的表格,你最终会找到一个通用的公式。对于有R行和C列的表,可以更改个人(R1)和(C1)的数量。这是独立卡方检验的自由公式!自由度定义了卡方分布来评估独立测试。

卡方分布是正态分布,随着自由度的增加,卡方分布接近正态曲线。自由度在返回和返回的上下文中,自由度经常被谈论。与其失去一个剩余的读者,还不如读这篇文章(嗨,妈妈!),我就开门见山了。回想一下,自由度通常等于观测值(或信息)的数量——参数估计值的数量。当您执行“返回”时,参数会估计模型中的每个项,每个项都消耗一个自由度。因此,包含多米回归模型以降低过度自由度可以估计参数的可变性。事实上,如果您的模型中没有足够的数据量,甚至可能没有足够的自由度误差项,也没有要计算的假设值或F值。你会得到这样的输出。

如果发生这种情况,您需要收集更多的数据(增加自由度)或从模型中删除它(减少所需的自由度)。虽然它存在于一个随机向量的域中,但是自由度确实影响了你的数据分析。

  • 发表于 2021-04-05 15:29
  • 阅读 ( 3025 )
  • 分类:互联网

0 条评论

请先 登录 后评论
许航
许航

707 篇文章

你可能感兴趣的文章

相关问题