2026/1/7 15:08:20
网站建设
项目流程
wordpress 流量站,深圳公司网站建设案例,织梦素材网站模板,仿公众号网站人工智能之数学基础 离散数学
第四章 离散概率 文章目录 人工智能之数学基础 离散数学前言一、离散概率基础1. 概率空间#xff08;Probability Space#xff09;2. 条件概率与贝叶斯定理 二、离散型随机变量#xff08;Discrete Random Variable#xff09;1. 定义2. 概率…人工智能之数学基础 离散数学第四章 离散概率文章目录人工智能之数学基础 离散数学前言一、离散概率基础1. 概率空间Probability Space2. 条件概率与贝叶斯定理二、离散型随机变量Discrete Random Variable1. 定义2. 概率质量函数PMF三、重要离散分布1. 伯努利分布Bernoulli Distribution2. 二项分布Binomial Distribution3. 其他重要分布四、期望与方差1. 期望Expectation2. 方差Variance五、AI 中的离散概率应用1. 分类任务的统计建模2. 贝叶斯分类器3. 强化学习中的动作选择六、Python 代码实现1. 导入库2. 伯努利与二项分布 PMF 可视化3. 二项分布模拟分类任务性能分析4. 自定义二项 PMF 与累积分布CDF5. AI 应用分类误差的假设检验6. 泊松近似二项分布七、总结后续资料关注前言离散概率是离散数学与概率论的交叉核心为机器学习中的分类、采样、不确定性建模提供理论基础。本文系统讲解离散概率空间与基本公理离散型随机变量及其分布重要离散分布伯努利、二项、泊松、几何期望与方差在 AI 分类任务中的应用如二项分布建模正确/错误预测配套 Python 代码实现scipy.stats、自定义模拟、可视化、分类误差分析一、离散概率基础1. 概率空间Probability Space三元组 $ (\Omega, \mathcal{F}, P) $样本空间 $ \Omega $所有可能结果的集合离散 ⇒ 可数**事件域 $ \mathcal{F}∗ ∗ **∗∗\Omega $ 的子集族通常为幂集概率测度 $ P $满足$ 0 \leq P(A) \leq 1 $$ P(\Omega) 1 $可列可加性若 $ A_i $ 互斥则 $ P\left(\bigcup_i A_i\right) \sum_i P(A_i) $✅ 示例掷骰子$ \Omega {1,2,3,4,5,6} P({1}) \frac{1}{6} $2. 条件概率与贝叶斯定理条件概率P ( A ∣ B ) P ( A ∩ B ) P ( B ) , P ( B ) 0 P(A \mid B) \frac{P(A \cap B)}{P(B)}, \quad P(B) 0P(A∣B)P(B)P(A∩B),P(B)0贝叶斯定理P ( H ∣ E ) P ( E ∣ H ) P ( H ) P ( E ) → ∗ ∗ 朴素贝叶斯分类器 ∗ ∗ 的理论基础 P(H \mid E) \frac{P(E \mid H) P(H)}{P(E)} → **朴素贝叶斯分类器**的理论基础P(H∣E)P(E)P(E∣H)P(H)→∗∗朴素贝叶斯分类器∗∗的理论基础二、离散型随机变量Discrete Random Variable1. 定义函数 $ X: \Omega \to \mathbb{R} $其取值为可数集合有限或可列无限。2. 概率质量函数PMFp X ( x ) P ( X x ) 满足 p_X(x) P(X x) 满足pX(x)P(Xx)满足$ p_X(x) \geq 0 $$ \sum_{x} p_X(x) 1 $ 对比连续变量用概率密度函数PDF三、重要离散分布1. 伯努利分布Bernoulli Distribution场景单次试验成功1或失败0PMFP ( X x ) p x ( 1 − p ) 1 − x , x ∈ { 0 , 1 } P(X x) p^x (1 - p)^{1 - x}, \quad x \in \{0, 1\}P(Xx)px(1−p)1−x,x∈{0,1}记作$ X \sim \text{Bernoulli}§ $期望/方差E [ X ] p , Var ( X ) p ( 1 − p ) \mathbb{E}[X] p, \quad \text{Var}(X) p(1 - p)E[X]p,Var(X)p(1−p)✅AI 应用单个二分类预测如“是否垃圾邮件”2. 二项分布Binomial Distribution场景$ n $ 次独立伯努利试验成功次数PMFP ( X k ) ( n k ) p k ( 1 − p ) n − k , k 0 , 1 , … , n P(X k) \binom{n}{k} p^k (1 - p)^{n - k}, \quad k 0,1,\dots,nP(Xk)(kn)pk(1−p)n−k,k0,1,…,n记作$ X \sim \text{Binomial}(n, p) $期望/方差E [ X ] n p , Var ( X ) n p ( 1 − p ) \mathbb{E}[X] np, \quad \text{Var}(X) np(1 - p)E[X]np,Var(X)np(1−p)✅AI 核心应用分类任务性能建模假设模型准确率为 $ p $在 $ n $ 个测试样本中正确预测 $ k $ 个的概率A/B 测试比较两个模型的成功率3. 其他重要分布分布场景PMF期望几何分布首次成功所需试验次数$ P(Xk) (1-p)^{k-1}p $$ 1/p $泊松分布单位时间事件发生次数$ P(Xk) \frac{\lambda^k e^{-\lambda}}{k!} $$ \lambda $多项分布多类别分类扩展二项$ P(\mathbf{X}\mathbf{k}) \frac{n!}{k_1!\cdots k_m!} p_1^{k_1}\cdots p_m^{k_m} $$ np_i $泊松近似当 $ n $ 大、$ p $ 小、$ \lambda np $ 适中时$ \text{Binomial}(n,p) \approx \text{Poisson}(\lambda) $四、期望与方差1. 期望ExpectationE [ X ] ∑ x x ⋅ p X ( x ) \mathbb{E}[X] \sum_{x} x \cdot p_X(x)E[X]x∑x⋅pX(x)线性性$ \mathbb{E}[aX bY] a\mathbb{E}[X] b\mathbb{E}[Y] $无需独立2. 方差VarianceVar ( X ) E [ ( X − E [ X ] ) 2 ] E [ X 2 ] − ( E [ X ] ) 2 \text{Var}(X) \mathbb{E}[(X - \mathbb{E}[X])^2] \mathbb{E}[X^2] - (\mathbb{E}[X])^2Var(X)E[(X−E[X])2]E[X2]−(E[X])2性质$ \text{Var}(aX b) a^2 \text{Var}(X) $五、AI 中的离散概率应用1. 分类任务的统计建模假设测试集有 $ n 1000 $ 个样本模型真实准确率 $ p 0.85 $则正确预测数 $ X \sim \text{Binomial}(1000, 0.85) $可计算$ P(X \geq 840) $模型表现不低于 84% 的概率置信区间$ \hat{p} \pm z \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $2. 贝叶斯分类器使用贝叶斯定理计算后验概率P ( y ∣ x ) P ( x ∣ y ) P ( y ) P ( x ) P(y \mid \mathbf{x}) \frac{P(\mathbf{x} \mid y) P(y)}{P(\mathbf{x})}P(y∣x)P(x)P(x∣y)P(y)朴素贝叶斯假设特征条件独立 → 乘积形式3. 强化学习中的动作选择策略 $ \pi(a \mid s) $ 是离散概率分布如 softmax 输出六、Python 代码实现1. 导入库importnumpyasnpimportmatplotlib.pyplotaspltimportseabornassnsfromscipy.statsimportbernoulli,binom,poissonfromscipy.specialimportcomb# 设置风格sns.set(stylewhitegrid)plt.rcParams[font.sans-serif][SimHei]# 支持中文2. 伯努利与二项分布 PMF 可视化# 参数p0.7n10# 伯努利分布x_bern[0,1]pmf_bern[1-p,p]# 二项分布x_binomnp.arange(0,n1)pmf_binombinom.pmf(x_binom,n,p)# 绘图fig,axesplt.subplots(1,2,figsize(12,4))# 伯努利axes[0].bar(x_bern,pmf_bern,colorskyblue,edgecolorblack)axes[0].set_title(伯努利分布 (p0.7))axes[0].set_xlabel(X);axes[0].set_ylabel(P(X))axes[0].set_xticks([0,1])# 二项分布axes[1].bar(x_binom,pmf_binom,colorlightcoral,edgecolorblack)axes[1].set_title(f二项分布 (n{n}, p{p}))axes[1].set_xlabel(成功次数 k);axes[1].set_ylabel(P(Xk))plt.tight_layout()plt.show()3. 二项分布模拟分类任务性能分析# 模拟1000 次实验每次测试 100 个样本真实准确率 0.8np.random.seed(42)n_trials1000n_samples100true_acc0.8# 模拟正确预测数correct_countsnp.random.binomial(n_samples,true_acc,sizen_trials)# 理论分布x_theorynp.arange(70,91)pmf_theorybinom.pmf(x_theory,n_samples,true_acc)# 绘图模拟 vs 理论plt.figure(figsize(10,5))plt.hist(correct_counts,bins20,densityTrue,alpha0.6,label模拟结果,colorlightgreen)plt.plot(x_theory,pmf_theory,ro-,label理论 PMF)plt.axvline(n_samples*true_acc,colorred,linestyle--,labelf期望值 {n_samples*true_acc})plt.title(分类任务正确预测数分布n100, p0.8)plt.xlabel(正确预测数);plt.ylabel(概率密度)plt.legend()plt.show()# 计算 95% 置信区间经验lowernp.percentile(correct_counts,2.5)uppernp.percentile(correct_counts,97.5)print(f95% 经验置信区间: [{lower:.1f},{upper:.1 f}])print(f理论标准差:{np.sqrt(n_samples*true_acc*(1-true_acc)):.2f})4. 自定义二项 PMF 与累积分布CDFdefbinom_pmf(k,n,p):手动计算二项 PMFifk0orkn:return0.0returncomb(n,k)*(p**k)*((1-p)**(n-k))defbinom_cdf(k,n,p):手动计算二项 CDFreturnsum(binom_pmf(i,n,p)foriinrange(0,k1))# 测试n,p5,0.5forkinrange(n1):print(fP(X ≤{k}) {binom_cdf(k,n,p):.4f})# 验证与 scipy 一致assertabs(binom_cdf(3,5,0.5)-binom.cdf(3,5,0.5))1e-10print(✅ 手动实现与 scipy 一致)5. AI 应用分类误差的假设检验问题模型 A 在 1000 个样本上正确 850 个模型 B 正确 830 个。差异是否显著fromstatsmodels.stats.proportionimportproportions_ztest# 数据countnp.array([850,830])nobsnp.array([1000,1000])# 双样本比例 z 检验stat,pvalproportions_ztest(count,nobs)print(fZ 统计量:{stat:.4f})print(fp 值:{pval:.4f})ifpval0.05:print(✅ 差异显著p 0.05)else:print(❌ 差异不显著) 原理在零假设两模型准确率相同下正确数服从二项分布可用正态近似进行检验。6. 泊松近似二项分布n_large1000p_small0.01lamn_large*p_small# λ 10xnp.arange(0,20)pmf_binombinom.pmf(x,n_large,p_small)pmf_poissonpoisson.pmf(x,lam)plt.figure(figsize(8,5))plt.plot(x,pmf_binom,bo-,labelBinomial(n1000, p0.01))plt.plot(x,pmf_poisson,r*--,labelPoisson(λ10))plt.title(泊松近似二项分布n大, p小)plt.xlabel(k);plt.ylabel(P(Xk))plt.legend()plt.show()七、总结概念公式AI 应用伯努利分布$ P(X1)p $单样本二分类预测二项分布$ \binom{n}{k} p^k (1-p)^{n-k} $分类准确率建模、A/B 测试泊松分布$ \frac{\lambda^k e^{-\lambda}}{k!} $稀有事件建模如异常检测期望$\mathbb{E}[X] \sum x p(x) $损失函数设计、策略梯度方差$ \text{Var}(X) \mathbb{E}[X^2] - (\mathbb{E}[X])^2 $不确定性量化、置信区间关键洞见离散概率是理解分类模型性能不确定性的语言二项分布是评估准确率的标准工具贝叶斯思维贯穿整个 AI 决策过程避免“点估计陷阱”报告准确率时应附带置信区间如 85% ± 1.2%。后续python过渡项目部分代码已经上传至gitee后续会逐步更新。资料关注公众号咚咚王giteehttps://gitee.com/wy18585051844/ai_learning《Python编程从入门到实践》《利用Python进行数据分析》《算法导论中文第三版》《概率论与数理统计第四版 (盛骤) 》《程序员的数学》《线性代数应该这样学第3版》《微积分和数学分析引论》《西瓜书周志华-机器学习》《TensorFlow机器学习实战指南》《Sklearn与TensorFlow机器学习实用指南》《模式识别第四版》《深度学习 deep learning》伊恩·古德费洛著 花书《Python深度学习第二版(中文版)【纯文本】 (登封大数据 (Francois Choliet)) (Z-Library)》《深入浅出神经网络与深度学习(迈克尔·尼尔森MichaelNielsen》《自然语言处理综论 第2版》《Natural-Language-Processing-with-PyTorch》《计算机视觉-算法与应用(中文版)》《Learning OpenCV 4》《AIGC智能创作时代》杜雨张孜铭《AIGC原理与实践零基础学大语言模型、扩散模型和多模态模型》《从零构建大语言模型中文版》《实战AI大模型》《AI 3.0》