【2024数模国赛赛题思路公开】国赛B题思路丨附可运行代码丨无偿自提

2024年国赛B题解题思路

问题 1: 抽样检测方案设计

【题目分析】

分析:

  • 目标是设计一个高效的抽样检测方案,在尽量少的样本数量下,确保在高信度水平下做出正确的接受或拒收决策。
  • 需要处理两个不同的信度要求,这对样本量的计算提出了挑战。

思路:

  • 贝叶斯抽样优化:可以使用贝叶斯方法结合贝叶斯抽样优化(Bayesian Optimization)来动态调整样本量,以达到所需的信度水平。通过将次品率建模为贝叶斯后验分布,可以逐步减少样本量,同时保证决策的可靠性。
  • 自适应序贯抽样:使用逐步抽样方法,根据初始样本的检测结果动态调整后续样本量,优化检测成本和时间。
  • 蒙特卡洛模拟:模拟大量的抽样检测场景,估计在不同样本量下达成信度要求的概率,找到最小样本量的解决方案。

【解题思路】

目标

设计一个抽样检测方案,以确定是否接受供应商提供的零配件,要求在尽可能少的检测次数下达到两个信度标准:

  1. 在 95% 信度下认定零配件次品率超过标称值(拒收)。
  2. 在 90% 信度下认定零配件次品率不超过标称值(接收)。

建模过程

  1. 定义变量和假设
    • 设次品率为p ,标称次品率为p0=0.10 (即10%)。
    • 抽样样本量为n ,检测出次品的数量为 x。
    • 我们需要对p  进行假设检验,并根据检验结果决定是否接受或拒收。

    2. 抽样检测模型

  • 根据二项分布,我们有
  • 检验假设:

原假设

备择假设(用于拒收的情况)

  • 使用正态近似来简化问题,当 n较大时, 可近似为正态分布:

  • 标准化后的检测统计量为:

3. 检验条件

  • 我们设定显著性水平α  对应的信度为1-α 。
  • 对于拒收情况,信度为 95%,则 α=0.05。
  • 计算临界值:,其中为标准正态分布的逆函数。
  • 对于接收情况,信度为 90%,则 α=0.10。

4. 计算样本量n

    • 拒收的决策规则:若 Z>Z0.05,则拒收。
    • 结合样本量的计算公式,我们得到:

  • 通过展开可以得到对 n 的不等式:

  • 为简化计算,可以迭代求解n。

5. 智能优化算法引入

  • 为了优化样本量 n,引入贝叶斯优化。贝叶斯优化是一种基于高斯过程(Gaussian Process)的黑箱优化方法,可以在不确定的环境下高效找到最优参数。
  • 步骤
    1. 定义目标函数:最小化检测成本 ,其中 c 为单次检测成本。
    2. 目标函数中包含信度约束,使用贝叶斯优化逐步逼近最优的 n。
    3. 通过模拟不同的样本量 n,评估在95%和90%信度下的检测成功率,并调整 n 使得目标函数最小。

6. 贝叶斯优化流程

    • 初始化样本集,随机选择 n0 的样本量进行检测,计算检测成本。
    • 使用高斯过程拟合当前的检测结果。
    • 通过高斯过程预测新的 n,并计算期望改进(Expected Improvement, EI)。
    • 选择使期望改进最大的 n 作为下一步的检测样本量。
    • 更新高斯过程模型,重复迭代,直到找到满足信度约束且成本最低的样本量n* 。

7. 最终方案

  • 通过贝叶斯优化得到的最优样本量 n*,将其应用于实际的检测流程中,以确保在满足信度要求的情况下尽可能减少检测次数。

公式总结

检测统计量:

临界值条件:Z>Z0.05拒收,Z<Z0.10接受

样本量不等式:

目标函数最小化:

Python参考代码】

# 定义检测成本函数
def detection_cost(n, c):
    return n * c

# 定义统计检验函数
def hypothesis_test(n, p0, alpha, x):
    # 计算标准化的Z统计量
    p_hat = x / n
    Z = (p_hat - p0) / np.sqrt(p0 * (1 - p0) / n)
    # 计算临界值
    Z_alpha = norm.ppf(1 - alpha)
    return Z, Z_alpha

# 定义目标函数,贝叶斯优化用
def objective(n):
    n = int(n[0])  # 样本量必须是整数
    c = 2  # 单次检测成本设为2元(可以根据具体情况调整)
    p0 = 0.10  # 标称次品率
    alpha_reject = 0.05  # 拒收信度为95%
    alpha_accept = 0.10  # 接收信度为90%

    # 模拟检测x个次品

    x = binom.rvs(n, p0)  # 假设次品率刚好为标称值

    # 进行拒收和接收检验
    Z_reject, Z_alpha_reject = hypothesis_test(n, p0, alpha_reject, x)
    Z_accept, Z_alpha_accept = hypothesis_test(n, p0, alpha_accept, x)

    # 判断是否满足信度条件
    if Z_reject > Z_alpha_reject and Z_accept < Z_alpha_accept:
        # 若同时满足拒收和接收信度要求,则计算成本
        cost = detection_cost(n, c)
    else:
        # 若不满足信度要求,则设为较高的惩罚成本
        cost = detection_cost(n, c) + 1000  # 惩罚项

    return cost

from skopt.space import Real, Integer

# 定义优化参数空间
param_space = [Integer(10, 1000, name='n')]

# 使用贝叶斯优化进行最小化
result = gp_minimize(objective, param_space, n_calls=50, random_state=0)

# 输出最优样本量和最小检测成本
print(f"Optimal sample size: {result.x[0]}")
print(f"Minimum detection cost: {result.fun}")
# 绘制优化过程的收敛情况
plot_convergence(result)
plt.title('Convergence Plot of Bayesian Optimization')
plt.xlabel('Number of Calls')
plt.ylabel('Objective Function Value (Cost)')
plt.grid(True)
plt.show()

# 绘制样本量与检测成本的关系
sample_sizes = np.arange(10, 1000, 10)
costs = [objective([n]) for n in sample_sizes]

plt.figure(figsize=(10, 6))
plt.plot(sample_sizes, costs, '-o', markersize=4, color='b', label='Detection Cost')
plt.axvline(result.x[0], color='r', linestyle='--', label=f'Optimal Sample Size: {result.x[0]}')
plt.title('Detection Cost vs. Sample Size')
plt.xlabel('Sample Size')
plt.ylabel('Detection Cost')
plt.legend()
plt.grid(True)
plt.show()



http://www.niftyadmin.cn/n/5642044.html

相关文章

基于.NET6的WPF总结之MVVM

目录 1. DataContext数据上下文 2. Binding绑定源 2.1 绑定实体 2.2 绑定资源 2.3 ElementName属性指明另一个控件作为数据源 2.4 RelativeSource属性绑定一个相对的数据源 2.4.1 Self&#xff08;绑定自身控件&#xff09; 2.4.2 FindAncestor&#xff08;找上级&#…

交友系统“陌陌”全方位解析

交友系统在现代社会中扮演着越来越重要的角色&#xff0c;尤其是随着互联网技术的发展&#xff0c;各种交友软件层出不穷。陌陌作为其中的佼佼者&#xff0c;其全方位解析对于理解交友系统的商业开发至关重要。 陌陌的核心功能是提供基于地理位置的社交服务&#xff0c;用户可…

macos 系统文件操作时提示 Read-only file system 解决方法

这个情况是因为文件系统为只读, 需要我们执行一下命令重新将系统文件挂载为读写模式, 命令如下: sudo mount -uw / 这里的 mount 就是硬盘挂载命令, 后面的 -uw选项说明如下, 最后的 / 表示的是跟目录, 可以指定要修改的挂载路径,也可以默认. -u -u标志表示应更改已装载文…

DataSet和DataTable的关系

C#中的DataTable 在C#中&#xff0c;DataTable 是 System.Data 命名空间下的一个类&#xff0c;它是 DataSet 的一个组件&#xff0c;用于存储表格形式的数据。DataTable 可以独立于数据库使用&#xff0c;也可以与数据库表相关联&#xff0c;用于数据的读取、更新、插入和删除…

android 通过 Wi-Fi adb连接到设备

Android 11&#xff08;API 级别 30&#xff09;及更高版本支持使用 Android 调试桥 (adb) 从工作站以无线方式部署和调试应用。例如&#xff0c;您可以将可调试应用部署到多台远程设备&#xff0c;而无需通过 USB 实际连接您的设备。这样&#xff0c;您便无需处理常见的 USB 连…

60.以太网数据回环实验(3)以太网数据收发器接收模块

&#xff08;1&#xff09;状态设计&#xff1a; ST_IDLE :空闲状态ST_PREAMBLE :前导码帧起始界定符ST_ETH_HEAD :以太网帧头&#xff1a;目标MAC地址源MAC地址类型/长度ST_IP_HEAD :IP首部ST_UDP_HEAD :UDP首部&#xff08;8个字节&#xff09;S…

Springboot整合【Kafka】

1.添加依赖 在pom.xml文件中添加以下依赖&#xff1a; <!-- 进行统一的版本管理--><parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.3.3</version>&l…

Spark MLlib模型训练—聚类算法 K-means

Spark MLlib模型训练—聚类算法 K-means K-means 是一种经典的聚类算法,广泛应用于数据挖掘、图像处理、推荐系统等领域。它通过将数据划分为 ( k ) 个簇(clusters),使得同一簇内的数据点尽可能相似,而不同簇之间的数据点差异尽可能大。Apache Spark 提供了 K-means 聚类…