您的当前位置:首页正文

非参数统计——期末试卷

2021-04-16 来源:步旅网
 每小题20分

1. 下面是DMBA公司为了研究某一种癌症所做的试验。Group 1和2分别代表试验的控制组和对照组。下面是所得的试验老鼠的生存数据,*代表数据被右删失。请回答下面问题:

Group 1: 164 188 190 192 206 209 213 216 220 230 234 246

265 304 216* 244*

Group 2: 156 163 198 205 232 233 239 240 261 280 296 323

204* 344*

1)请给出非参数的Kaplan-Meier估计的公式,并计算在时间点t=156,164这两点的具体估计值,若假设在t=164处被删失,计算此处的估计值。

2)如果协变量分别取为1和0,请用Cox模型模拟上述数据,给出计算协变量的系数的相关公式;

3)给出Kaplan-Meier估计的Matlab程序。

2. 下面是16个学生的体能测试数据: P81例3.14

82 53 70 73 103 71 69 80 54 38 87 91 62 75 65 77。 1) 请用顺序统计量方法构造置信度为95%的中位数的置信区间; 2) 编写上述计算的Matlab程序

3. 下面是申请进入法学院学习的学生的LSAT测试成绩和GPA成绩。

LSAT: 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594

GPA: 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74 2.76 2.88 3.96

每个数据点用Xi(Yi,Zi),其中Yi表示LSAT成绩,Zi表示GPA成绩 1) 计算Yi和Zi的Pearson相关系数 (只写出公式); (5分)

2) 使用Boostrap方法估计相关系数的标准误差(只写出算法步骤);(5分) 3) 编写相应的Matlab程序。(10分)

4. 假设数据(X1,X2,Xn)是来自真实密度为f(x)的简单随机字样,

1) 请给出该密度函数的直方图密度估计; 2) 求直方图密度估计的期望和方差;

3) 给出在平方损失下的最优窗宽公式,并证明此结论

5. 已知 随机变量Yi=m(xi)i,设计变量xi来自均匀分布U[0,1],i是服从均值和方

差分别为0和2的正态分布,请回答下列问题(每问各5分)

1) 假设函数m(x)完全未知,请用局部回归给出它的一个估计(取p=1,只写出公式); 2) 写出最优窗宽选择公式;

3) 请用Matlab实现上述计算(编写程序)[选Epanechikov核,假设m(x)xsin(x)] 4) 并作图比较m(x)和它的估计(并做出散点图);

2

因篇幅问题不能全部显示,请点此查看更多更全内容