但如若没有Borel点集以及Borel可测函数等概念manbetx 英超赛事

当前位置:manbetx 英超赛事 > manbetx 英超赛事 > 但如若没有Borel点集以及Borel可测函数等概念manbetx 英超赛事
作者: manbetx 英超赛事|来源: http://www.shuo520.com|栏目:manbetx 英超赛事

文章关键词:manbetx 英超赛事,以概率

  我本科的线性代数老师给我们期末复习的时候说过,这学期学的知识相当一部分内容说白了就是“会说这套行话”。其实我觉得几乎所有的数学基础课的作用都可以这样概括,它最主要的作用就是告诉你怎么把事情说清楚。

  具体到测度论在概率论里的作用,就是有些概率的陈述不用测度论是说不清楚的。即使是最简单的抛均匀硬币问题,初等概率论实际上只能处理抛有限次的情况。我如果问你不停的抛一枚均匀硬币永远都是正面的概率是多少,你也许可以用初等概率论的方法告诉我是0,但是如果你仔细想的话这中间是有gap的,就是当我问你这个事件发生的概率的时候,我到底是什么意思呢?如果你觉得这个问题不算问题,那就说明了你并没有真的认真深入的思考过这个问题,因为实际上当你的概率空间是无穷次抛硬币的结果的时候,就不像抛有限次的情况,因为你不能对所有“事件”定义概率了。不学习测度论,就无法严格说明这一点。接触条件期望后问题就更明显了。什么叫已知X时Y的期望?虽然直观上好像很好理解,但是如果你仔细想的话,用初等概率论是很难给出一个一般情况下的严格定义的,你可能需要分类讨论X, Y是连续随机变量或离散随机变量,或他们的混合,或更复杂。

  不过题主有这种想法是再正常不过的,人类也曾经很久都是在没有测度论基础上研究概率论,比如伯特兰悖论就是一个例子。人们也是慢慢意识到概率论需要一个更严格的基础,才引入测度论把它严格化的。

  还有一种可能是题主的领域不需要接触这些。就像有时候你只要会套公式求导就可以,极限、导数的严格定义当成黑箱子不需要知道。所以到底需要学习多深还是要视具体情况而定。

  对于机器学习来说,大部分情况不需要用到测度论。但是一些corner case如果不用测度论会导致一些奇怪的结果。

  机器学习中概率和概率密度的混用比较随意,有时候会导致连续和离散的情况不一致。不用测度论,简单的把一些离散情况扩展到连续情况很可能有问题。比如,不用测度论的语言你甚至不能定义连续分布的熵(entropy)。对于一个连续分布,有个叫differential entropy的东西

  很多人把这东西当作连续分布的entropy的定义。首先这东西就不是transformation invariant的。甚至你变换个坐标系,这东西的值都会变。

  实际从测度论角度这东西压根就ill-defined,但是用这东西进行推导的ML论文依然不计其数,甚至ML教科书都是这么教的。而正确的定义是

  还有就是涉及到无穷维空间/泛函空间的分布,也就是各种process(Dirichlet process,Gaussian process等等)的时候就需要测度论了。functional space没有概率密度,只有测度。这样,你就不得不使用测度论的语言。

  总之,对ML领域除了nonparametric Bayesian里很少的理论paper外,不是很多必须用到测度论的论文。但懂点测度论会帮助理解,毕竟有些作者为了严格还是喜欢用测度论语言。而一些不怎么懂概率论还强行概率模型的作者写出的扯淡论文你也更容易分辨出来。

  感谢邀请…我只能以一个学过概率论但还未学过测度论的人来发表我的观点,以下回答结合了《概率论基础》李贤平 书中在概率空间、随机变量及其分布以及各章末总结性的一些段落:

  概率论在20世纪以前是并没有严格的数学基础的,很多概率论里的基本概念是离不开测度论的。

  1.譬如说事件与概率的严格定义(Bertrand奇论说明了采用等可能性来定义概率其含义的不明确性)。而将事件看作集合,概率看作测度的定义明确了最重要的两个基本概念。首先,事件域F作为一个σ-代数,使得我们想要研究的事件都能够包含在内:因为一个σ-代数对集合的逆,并,交,差的可列次运算都封闭。就算我们想要研究的事件不在里面,我们也可以把想要研究的事件放在一起形成一个集合,然后生成一个包含该集合的最小σ-代数。其次,概率作为一个定义在事件域F上的规范测度,它总结并包含了古典概型(非负,规范以及有限可加)和几何概型(除上述三点之外,还有可列可加)等各种场合概率所应当具有的性质,但它并没有具体给出概率的任何直接计算公式或计算方法。这为不同问题定义不同的概率空间(Ω,F,P)提供了方便,去如何选定基本空间Ω,怎样构造事件域F,如何给定P可以视具体情况而定,只要满足公理体系所需满足的条件即可。

  2.此外,随机变量的严格定义也是脱离不开可测性的:一个随机变量需要满足的一个条件就是它在任一Borel点集上的原象集亦在事件域F上,从而可以给定概率。随机变量的概念是十分重要的,我们将对于事件的概率的研究转化为对于随机变量的研究,随机变量是取数值的,对它的研究可以采取各种各样的分析工具。但如若没有Borel点集以及Borel可测函数等概念,一个随机变量的函数是否是随机变量都说不清楚。

  3.极限定理中的以概率1收敛和强大数定律(Borel以及Kolmogorov)也运用到一些测度论中集合的运算,概率测度的一些结论,而强大数定律给出了相当深刻的结果。例如Borel强大数律:它说明了n次独立实验中的频率稳定性,即当实验次数n无限增加时,频率将趋于概率。它断言了这种事件发生的概率为1(在概率测度下一种几乎处处成立收敛性的概念-即以概率1收敛)

  上述仅列举了我暂时想到的一些与测度论紧密相关的重要内容。单就应用或直观理解概率模型而言,可能并不需要太多公理化结构的内容。但是,我更为同意以下这种说法:数学的各个分支都是需要公理化体系的,把最基本的假定公理化,其他一切结论则由它们演绎导出。这就像建筑一座大厦应该有它的地基一样,没有地基整个大厦行将坍塌。例如说,分析的基础是实数理论,由实数理论我们可以构建出整个分析大厦;还有就是微积分的基础是极限,没有Cauchy,Weierstrass等人给出的极限的ε语言的逻辑严格定义,那么Newton,Leibniz等人运用的各种微分,manbetx 英超赛事积分中的无穷小那就真的成为了幽灵。

  仅举个例子:为何一段区间的概率可为一实数,而单点的概率只能赋为0?无穷个0加起来不等于0?! ---------------于是此时你就需要学习measure theory 啦。

  2. 非数学专业的理工生可以从微积分和数学分析的角度理解连续分布概率模型

  比如,一个实数是有理数的概率是多少?这就是高等概率论中的问题。某种意义上说, 这个概率是0

  初等概率论会导致很多悖论,因为“随机”这个东西不好描述,于是一个问题就有多种“随机”的取法,然后同一个概率论问题就有几个答案(经典的贝特朗悖论)。

  所以科尔莫戈罗夫等人做了概率公理化的工作,使得概率论成为一个重要的分支而非一个不起眼的东西。那么公理化的基础是什么呢?就是测度(包括但不限于勒贝格测度),所以说以测度为基础的“高等”概率论应用深度和广度都是初等概率论不可比的。

  更加严格的去理解概率吧= =要不然有些高阶的东西理解起来很困难,亲眼见到概率课很多东西本来想用测度和实变的语言去描述,但是为了 照顾很多学金融的同学没学过测度然后强行删掉测度相关= =对了还有不少人问我1A(indicator function)是什么意思,为什么E(x)=E((xY)),我总不能告诉他们这是条件期望的定义吧= =明明课件上不是这么说的啊!

  通常学的概率只是测度中的一种,成为概率测度,研究完测度论中测度的性质,大概就清楚概率的性质来源

下一篇:没有了

网友评论

我的2016年度评论盘点
还没有评论,快来抢沙发吧!