学术文章

库存策略的深度强化学习方法在仿真环境中的测试


在这项工作中,研究人员采取了一个根本原因,使供应商管理的库存绩效测量方法分配责任的表现不佳。此外,该工作还提出了一种基于强化学习的解决方法,用于确定VMI设置中的最佳补充策略。采用仿真模型作为培训环境,根据英飞凌科技股份有限公司的真实数据生成不同的需求场景,并根据关键性能指标进行比较。

Baidu