数学统计基础-概率论与数理统计

摘要:
排名数:组合数:关联规则:1.联合概率和条件概率联合概率:P(AB)两种概率同时发生的概率2.关联规则算法数据分析和选择这一发现为企业带来了大量利润,但是,如何从庞大而混乱的大数据中找到啤酒和尿布销售之间的关系呢?这给了我们什么样的启示?关联规则挖掘的一个典型例子是购物篮分析。关联规则的研究有助于发现交易数据库中不同商品(项目)之间的关系,并找出客户的购买线

数学统计基础-概率论与数理统计第1张

 数学统计基础-概率论与数理统计第2张数学统计基础-概率论与数理统计第3张

排列数:

 数学统计基础-概率论与数理统计第4张

 组合数:

数学统计基础-概率论与数理统计第5张

 数学统计基础-概率论与数理统计第6张数学统计基础-概率论与数理统计第7张

 数学统计基础-概率论与数理统计第8张

 关联规则:

 1、联合概率和条件概率

联合概率:P(AB)两个概率同时发生的概率

数学统计基础-概率论与数理统计第9张

 数学统计基础-概率论与数理统计第10张

数学统计基础-概率论与数理统计第11张数学统计基础-概率论与数理统计第12张

 2、关联规则算法

 数学统计基础-概率论与数理统计第13张数学统计基础-概率论与数理统计第14张

数学统计基础-概率论与数理统计第14张

 数据分析精选

这个发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的大数据中,发现啤酒和尿布销售之间的联系呢?这又给了我们什么样的启示呢?
关联规则分析
关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,

找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。

 3、全概率公式

条件概率、全概率=贝叶斯公式

数学统计基础-概率论与数理统计第16张

 数学统计基础-概率论与数理统计第17张

 4、贝叶斯公式

数学统计基础-概率论与数理统计第18张

 数学统计基础-概率论与数理统计第19张

 P(B)=3/5 * 2/4  +  2/5 * 3/4 =3/5

2/4=P(B|A) 在A发生的条件下B发生 (先因后果)

P(A/B)在B发生的条件下B发生 (先果后因)

贝叶斯公式及例题

数学统计基础-概率论与数理统计第20张

 数学统计基础-概率论与数理统计第21张

14个数据,Y:9个买,X:5个不买

A对应age

B对应 学student

 判断是否为学生预测购买的概率

 三、一维随机变量及其分布

数据的分散情况,分布在各未知的概率

数学统计基础-概率论与数理统计第22张

 数学统计基础-概率论与数理统计第23张

区间的每个值都可以取到-----连续

只能取区间的部分点------离散

3.1离散型随机变量及其分布

数学统计基础-概率论与数理统计第24张

 数学统计基础-概率论与数理统计第25张

 Bernoulli分布

数学统计基础-概率论与数理统计第26张数学统计基础-概率论与数理统计第27张

 数学统计基础-概率论与数理统计第28张

 Poisson分布--

当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦0.05时,就可以用泊松公式近似得计算。

通俗理解泊松分布

数学统计基础-概率论与数理统计第29张

 数学统计基础-概率论与数理统计第30张数学统计基础-概率论与数理统计第31张

 数学统计基础-概率论与数理统计第32张数学统计基础-概率论与数理统计第33张

四、连续型随机变量及其概率密度

 数学统计基础-概率论与数理统计第34张

 数学统计基础-概率论与数理统计第35张数学统计基础-概率论与数理统计第36张

均匀分布

 数学统计基础-概率论与数理统计第37张数学统计基础-概率论与数理统计第38张

指数分布

指数分布公式的含义是什么?

数学统计基础-概率论与数理统计第39张数学统计基础-概率论与数理统计第40张

正态分布

数学统计基础-概率论与数理统计第41张

数学统计基础-概率论与数理统计第42张

标准正态分布:
期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

数学统计基础-概率论与数理统计第43张数学统计基础-概率论与数理统计第44张

 用软件处理小批量数据 例如500M的SPSS ,电脑就带不动,必须用代码Python

spss侧重于假设和检验

python侧重于大数据的 统计推断 

泊松分布表示的是事件发生的次数,“次数”这个是离散变量,所以泊松分布是离散随机变量的分布。

指数分布是两件事情发生的平均间隔时间,“时间”是连续变量,所以指数分布是一种连续随机变量的分布。

可以用等公交车作为例子:

某个公交站台一个小时内出现了的公交车的数量 就用泊松分布来表示

某个公交站台任意两辆公交车出现的间隔时间 就用指数分布来表示

 数学统计基础-概率论与数理统计第45张数学统计基础-概率论与数理统计第46张

 P(X<2)-P(X<1)

最小二乘法

做预测,做回归

最小二乘法,所谓“二乘”就是平方的意思
数学统计基础-概率论与数理统计第47张

 数学统计基础-概率论与数理统计第48张

极大似然方法

极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!

换句话说,极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。

五、数值特征

 5.1数学期望

 数学统计基础-概率论与数理统计第49张

 体现数据的集中性

 随机变量的数字特征

 5.2 方差

 体现数据的波动情况、越大说明波动越大

 数学统计基础-概率论与数理统计第50张数学统计基础-概率论与数理统计第51张

数学统计基础-概率论与数理统计第52张数学统计基础-概率论与数理统计第53张

如何通俗地理解协方差和相关系数?
协方差代表了两个变量之间的是否同时偏离均值。

 数学统计基础-概率论与数理统计第54张

 数学统计基础-概率论与数理统计第55张

 5.3 大数定律和中心极限定理

 大数定律:当次数足够多可以用频率代替概率

 数学统计基础-概率论与数理统计第56张

简单而言,大数定律讲的是样本均值收敛到总体均值(就是期望)
数学统计基础-概率论与数理统计第57张

中心极限定律

而中心极限定理告诉我们,当样本量足够大时,样本均值的分布慢慢变成正态分布,就像这个图:
数学统计基础-概率论与数理统计第58张

 抽样分布

抽样分布就是统计量的分布,其特点是不包含未知参数且尽可能多的概括了样本信息。

除了常见的正态分布之外,还有卡方分布、t分布和F分布为最常见的描述抽样分布的分布函数。

这几个分布函数在数理统计中也非常有名。我们常说的卡方检验、t检验和F检验就跟这三个分布有关。
下面分别从定义、性质、函数图像和分位数等方面介绍三大分布。

 

免责声明:文章转载自《数学统计基础-概率论与数理统计》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Windows phone 8 学习笔记(3) 通信(转)Win10版《芒果TV》全平台直播第89届奥斯卡颁奖典礼,特设第二演播室带来一手资讯下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

03.pandas数据DataFrame

import pandas as pd #1. columns=["数学","英语","语文","理科综合","文科综合"] index=["top2","c9","985","211","1本","2本","3本","大专"] data={ "数学":[145,140,135,130,125,120,115,100], "英语":[145...

【tensorflow2.0】张量的数学运算

张量的操作主要包括张量的结构操作和张量的数学运算。 张量结构操作诸如:张量创建,索引切片,维度变换,合并分割。 张量数学运算主要有:标量运算,向量运算,矩阵运算。另外我们会介绍张量运算的广播机制。 本篇我们介绍张量的数学运算。 一,标量运算 张量的数学运算符可以分为标量运算符、向量运算符、以及矩阵运算符。 加减乘除乘方,以及三角函数,指数,对数等常见函数,...

统计学中抽样比例一般占百分之多少

要具体问题具体分析,一般和要求的误差限、置信区间及总体方差有关系.比如最基本的简单随机抽样,其样本量确定公式就是1/n=1/N+d^2/(u^2*S^2).样本量和误差限成反比,和置信区间及总体方差成正比.请问一堆url怎么算方差。(。。。)...

python正态分布

1、生成正态分布数据并绘制概率分布图 import pandas as pd import numpy as np import matplotlib.pyplot as plt # 根据均值、标准差,求指定范围的正态分布概率值 def normfun(x, mu, sigma): pdf = np.exp(-((x - mu)**2)/(2*...

从数学到密码学(十九)

数字证书、CA及PKI(二) 本节我们正式验证数字证书sslclientcert中签名的合法性,根据RFC2459,证书内容分为三部分:tbsCertificate、signatureAlgorithm和signatureValue。证书中signatureAlgorithm内容是sha1WithRSAEncryption,结合RSA算法,得到验证公式如下...

ACM训练计划建议(转)

ACM训练计划建议 From:freecode#  Date:2015/5/20 前言: 老师要我们整理一份训练计划给下一届的学弟学妹们,整理出来了,费了不少笔墨,就也将它放到博客园上供大家参考。 菜鸟之作,大牛勿喷,如有不当或补充之处,欢迎指出。 本建议书分为三个阶段,大一、大二、大三。大四暂没整理,一方面是大四要面临考验和找工作的问题,坚持继续acm...