1.简单计算
max(最大值) sum(累加和) median(中位数) mean (平均值)
各列积:prod 实际都可以是两个参数,第二个为1(默认)按列,为二按行
求累计和、累计积、标准方差与升序排序 累计和函数CUMSUM,前n项的和, 累积积CUMPROD, 标准方差STD ,limit(求函数的极限)
2.Matlab实现t检验
T检验法:应用t分布理论对正态总体或近似服从正态分布的总体当方差
σ2未知时关于平均数的检验方法。
可以用于比较两组数据是否来自同一分布。(可以用于比较两组数据的
区分度)
例 研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,
其观察值如下表:
y1(喷施矮壮素) 160 160 200 160 200 170 150 210
y2(对照) 170 270 180 250 270 290 270 230 170
从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因
此假设H0:喷施矮壮素的株高与未喷的相同或更高,,即H0: μ1≥μ2
对HA: μ1<μ2,即喷施矮壮素的株高较未喷的为矮。显著水平
α=0.05。
按ν=7+8=15,查t 表得一尾t0.05=1.753(一尾测验t0.05等于两尾测验
的t0.10),现实得t=-3.05<- t0.05=-1.753,故P<0.05。 推断:否定
H0: μ1≥μ2,接受HA: μ1<μ2,即认为玉米喷施矮壮素后,其株
高显著地矮于对照。
1 x=[160 160 200 160 200 170 150 210]; 2 y=[170 270 180 250 270 290 270 230 170]; 3 [h,p,ci,stats]=ttest2(x,y,0.05,'left')
h =
1
p =
0.0040
ci =
-Inf -24.3220
stats =
tstat: -3.0545 df: 15 sd: 38.4599
计算x和y在5%的显著性水平下是否来自同一分布(假设是否被接受) 结果:h=0,则表明假设在5%的置信度下被接受,即x,y在统计上可看做
来自同一分布的数据;h=1,表明假设被拒绝,即x,y在统计上认为是来
自不同分布的数据,即有区分度。例如A1,A2两算法得出的结果分别为x
,y,且从均值上看mean(x)>mean(y),则对[h,sig,ci]=ttest2(x,y);当
h=1时,表明可以从统计上断定算法A1的结果大于A2的结果(即两组数据
均值的比较是有意义的),h=0则表示不能根据平均值来断定两组数据的
大小关系(因为区分度小)。
例 选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果。
组别 y1(A法) y2(B法) d
1 10 25 -15
2 13 12 1
3 8 14 -6
4 3 15 -12
5 20 27 -7
6 20 20 0
7 6 18 -12
1 y1=[10 13 8 3 20 20 6]; 2 y2=[25 12 14 15 27 20 18]; 3 [h,p,ci,stat]=ttest(y1,y2,0.05,'both')
h =
1
p =
0.0203(越大越不好,0.05是边界值)
ci =
-12.9797 -1.5917
stat =
tstat: -3.1309 df: 6 sd: 6.1567
3.方差分析
例 以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),试做方差分析。
药剂 苗高观察值 总和Ti 平均数
A 18 21 20 13 72 18
B 20 24 26 22 92 23
C 10 15 17 14 56 14
D 28 27 29 32 116 29
T=336 y=21
1 x=[18 20 10 28; 21 24 15 27; 20 26 17 29; 13 22 14 32] 2 [p,anovatab,stats]=anova1(x)
x =
18 20 10 28 21 24 15 27 20 26 17 29 13 22 14 32
p =
5.0626e-005
anovatab =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [504] [ 3] [ 168] [20.5714] [5.0626e-005] 'Error' [ 98] [12] [8.1667] [] [] 'Total' [602] [15] [] [] []
stats =
gnames: [4x1 char] n: [4 4 4 4] source: 'anova1' means: [18 23 14 29] df: 12 s: 2.8577
4.回归分析
1 x=[35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2]' 2 y=[12 16 9 2 7 3 13 9 -1]' 3 [p,s]=polyfit(x,y,1)
p =
-1.0996 48.5493
s =
R: [2x2 double] df: 7 normr: 8.6410
4.散点图
若直接画plot(x,y),则是折线图,
x,y为散点数据, scatter(x,y,'k*'), k为黑色,*为点型是散点图
若采用数据拟合,绘出的是平滑的曲线
1 x= linspace(1,10,10); 2 y=[1.1 2 4 6 5.5 4.1 7 6.5 9.1 3]; 3 a=polyfit(x,y,3); 4 x1=[0:0.01:10]; 5 y1=a(4)+a(3)*x1+a(2)*x1.^2+a(1)*x1.^3; 6 plot(x1,y1,'-r')
5.相关分析
[R,P,RLO,RUP]=CORRCOEF(x,y)