

该项目属于数学与应用数学学科中的数理统计领域。近些年来,随着科技的进步和数据采集技术的飞速发展,科学领域所面临的数据变得越来越复杂,高维数据、缺失数据和复杂设计的存在给数据的统计分析带来了极大的挑战,从而也成为统计学科研究的国际热点与难点问题。本项目的主要贡献是:针对这几类复杂数据提出了一些国际首创的具有重要理论和应用意义的统计分析方法,建立了它们的理论框架,为它们的广泛应用奠定了坚实的基础。主要创新点有:第一,首次建构了基于阈值方法的稀疏线性判别分析方法及其最优性理论。对于固定设计矩阵的高维线性模型,建立了阈值岭回归方法并证明了其收敛性,从理论上说明该方法相较于经典方法具备更快的收敛速度。第二,首次利用充分降维方法建立了高维非线性模型的理论误差界;首次建构了高维非线性模型的向前回归算法,并证明了该算法在最弱的条件下具备变量筛选的一致性。建立了部分充分降维的一般理论框架,并为部分线性多指标模型的指标参数提供了可靠有效且简便易行的样本估计。第三,首次解决不可忽略缺失数据的工具变量方法中参数模型的敏感性及模型选择问题,为不可忽略缺失数据的处理提供了全新的工具。一方面我们将倾向函数从参数形式发展到半参数形式,大大降低了对模型的敏感性。另一方面我们创新性的提出了不可忽略缺失数据下工具变量及参数模型的选择方法,证明了模型选择的相合性。第四,首次证明了自适应设计中在广义线性模型框架下t检验的保守性并提出基于自助法的有效检验方法。这一发现颠覆了人们的长期认知,对于医学、社会学等众多领域的实验设计和检验具有重要指导意义。 本项目8篇代表性论文均发表于统计学的国际顶级期刊,如Journal of the American Statistical Association, The Annals of Statistics, Biometrika, Biometrics。8篇代表性论文他引140次,SCI他引121次。引用期刊包括统计学和机器学习领域的多个国际顶级期刊如JASA,AOS,Biometrika,JMLR等,同时还广泛被引用于医学、社会学、工程学等多个领域的国际期刊。相关成果引领国内外10余个研究组跟进研究。项目提出的针对高维、缺失等现代复杂数据的稀疏性判别分析、迹追踪充分降维、半参数倾向函数等方法对统计学的思想、方法、理论和应用方面均具有重要意义。
查看原始页面 ![]()

