应用统计学与大数据 统计方法的发展及其在大数据中的应用

统计与决策 2020年第4期·总第544期 理论讨论基金项目:中国与“一带一路”沿线国家统计交流史研究(2019LY97) 作者简介:尤兵兵(1964-),男,湖北天门人,教授,博士生导师,研究方向:经济统计学。徐小婷(1994-),女,湖北鄂州人,硕士生,研究方向:经济统计学。 摘要:文章主要探讨和研究统计方法从产生到发展以及与大数据相互影响的发展过程。在现有统计方法历史的基础上,从统计方法的发展及其在大数据时代的应用角度,总结统计方法的内容与特点;通过时间序列数据和知识图谱,对比分析国内外统计方法研究的趋势与方向;基于分析比较结果,提出对统计方法发展方向的思考与预测。 关键词:统计方法;大数据;机器学习 文献码:C829.2 文献标识码:A 文章号:1002-6487 (2020) 04-0031-04 统计方法的发展及其在大数据中的应用 尤冰冰应用统计学与大数据,徐晓婷 (武汉大学经济与管理学院,武汉 430072) 0 引言 统计实践开始的时候只是简单的计数和描述,直到300多年前才与有关的数学理论相结合,形成了自己的研究方法和理论,即成为一门具有严谨逻辑框架的学科,叫做统计学。统计学的理论基础——概率论和数理统计、各种统计推断模型和方法以及近几十年来计算机和网络的普及所带来的数据获取和处理方面的巨大进步,对统计学发展的萌发和推动起了关键作用,使得统计方法在各个领域得到了广泛的应用。

随着统计学家及各相关领域专家的不懈努力,统计方法也在不断完善和改进。通过探究统计方法的发展趋势、其在大数据时代的应用与拓展以及未来的发展方向与前景,不仅可以加深对统计方法的认识,而且可以为今后统计研究的发展方向提供借鉴和启发。1 统计方法发展不同阶段的概述1.1 统计方法的萌芽早期的统计实践始终局限于实用阶段,只是对一件事情进行调查、登记和验证。1671年诞生了政算学派和国算学派。在统计研究的内容上,国力学派致力于研究不同国家之间的国力比较,而政算学派则更多侧重于对生活中的人口和经济指标的研究。政算学派和国力学派的出现,使得统计学开始具备了不仅仅是计数和描述的功能。 他们把许多统计实践活动概括成统计理论,使统计知识系统化、全面化。此后,政算学派与国力学派经历了长达二百余年的争论期,最终双方分歧的解决,为以后统计学的发展奠定了坚实的基础。1.2 统计方法的重要发展1.2.1 概率论–统计学的基石 (1)早期概率论在政算学派与国力学派的争论时期,数学家们通过解决大量来自赌博的问题,创建了一门新的学科–概率论。组合公式、递归公式、条件概率和全概率公式以及期望概念的引入,使概率计算从简单的计数进入了更为精细的阶段。

早期概率论本身过于稚嫩,因此它与统计学的交集并没有很快拓展。但随着数学分析等数学理论的不断完善,概率论有了严谨的数学基础,在严谨性和普遍性上都有了很大的提高应用统计学与大数据,为其与统计学的交集拓展提供了基础。(2)大数定律 1685年前后,英国著名数学家伯努利完成了他的学术巨著《猜想的艺术》,但该书直到1713年才出版。在书中,他用数学把赌博中的现象理论化,提出了伯努利定理。伯努利定理是“大数定律”的原始形式,很多统计方法和理论都是以大数定律为基础的。(3)中心极限定理 从1733年中心极限定理被提出到20世纪30年代,它的最一般形式才得以完成。 这一时期,概率论研究的中心地位是独立变量和中心极限定理。中心极限定理的主要内容是:当样本量N→∞时,一系列变量的极限分布具有正态形。中心极限定理是数理统计学中大样本方法的基础。(4)随机过程19世纪,概率论的发展由研究相对静态的变量发展到研究随机变量的时间序列,即随机过程。随机过程的诞生,大大拓宽了概率论的应用和研究范围,使随机变量的研究由静态到动态取得了重大进展。

© 版权声明
THE END
喜欢就支持一下吧
点赞214赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容