• 用Python学分析


    1. t分布形状类似于标准正态分布
    2.  t分布是对称分布,较正态分布离散度强,密度曲线较标准正态分布密度曲线更扁平
    3.  对于大型样本,t-值与z-值之间的差别很小

    作用
    - t分布纠正了未知的真实标准差的不确定性
    - t分布明确解释了估计总体方差时样本容量的影响,是适合任何样本容量都可以使用的合适分布

    应用
    - 根据小样本来估计呈正态分布且方差未知的总体的均值
    - 对于任何一种样本容量,真正的平均值抽样分布是t分布,因此,当存在疑问时,应使用t分布

    样本容量对分布的影响
    - 当样本容量在 30-35之间时,t分布与标准正态分布难以区分
    - 当样本容量达到120时,t分布与标准正态分布实际上完全相同了

    自由度df对分布的影响
    - 样本方差使用一个估计的参数(平均值),所以计算置信区间时使用的t分布的自由度为 n - 1
    - 由于引入额外的参数(自由度df),t分布比标准正态分布的方差更大(置信区间更宽)
      - 与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高
      - 自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df= ∞ 时,t分布曲线为标准正态分布曲线

    图表显示t分布

    代码:

     1 # 不同自由度的学生t分布与标准正态分布
     2 import numpy as np
     3 from scipy.stats import norm
     4 from scipy.stats import t
     5 import matplotlib.pyplot as plt
     6 
     7 print('比较t-分布与标准正态分布')
     8 x = np.linspace( -3, 3, 100)
     9 plt.plot(x, t.pdf(x,1), label='df=1')
    10 plt.plot(x, t.pdf(x,2), label='df=20')
    11 plt.plot(x, t.pdf(x,100), label = 'df=100')
    12 plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal')
    13 plt.legend()
    14 plt.show()
    View Code

    运行结果:

  • 相关阅读:
    筛法“四不像”——《C解毒》试读
    五花八门的main()
    新编《守株待兔》—C语言版—兼聊为什么不应该用%d格式转换输出指针
    含糊之过、多做之过及乱做之过
    怎样调戏程序
    混乱是怎样炼成的——《C解毒》试读
    到处忙活与一劳永逸
    “函数声明”、“函数原型”与“函数定义”辨析
    关于函数原型的对话
    内裤外穿——错位及不伦不类
  • 原文地址:https://www.cnblogs.com/violetchan/p/10578440.html
Copyright © 2020-2023  润新知