近日,2024级工商管理学专业研究生张维建以第一作者身份在计算机科学领域国际知名期刊《Swarm and Evolutionary Computation》发表题为“A revised deep reinforcement learning algorithm for parallel machine scheduling problem under multi-scenario due date constraints”的研究论文。
《Swarm and Evolutionary Computation》是一本专注于报告基于群体智能和进化算法原理的自然启发智能计算领域最新研究和发展的同行评议期刊。该期刊发表关于两种计算范式及其混合方法的理论、实验和实践方面的先进、创新和跨学科研究,致力于及时出版高质量、经过同行评议的原创文章,推动进化计算和群体智能各方面的最新研究进展。根据2023年的中科院SCI分区,该刊为中科院一区期刊,JCR一区,影响因子为8.2。
论文深入研究了存储芯片制造背景下的复杂并行机调度问题,特别聚焦于包含强交期约束和弱交期约束的场景。针对该问题的NP难特性,本文提出了一种基于深度Q网络的深度强化学习框架,旨在高效解决这一复杂调度难题。在调度测试晶圆和普通晶圆的过程中,我们将问题精确建模为一个马尔可夫决策过程。为进一步提升模型的学习效率和稳定性,本文采用双重DQN算法进行训练,从而有效缓解了标准DQN方法中常见的高估偏差问题。实验结果表明,在存储芯片制造的多种调度场景中,DDQN算法的性能始终优于其他优化方法,充分展现了其在优化复杂制造过程中的强大潜力。
张维建是我校经济管理学院2020级本科生,并于2024年9月成功考取我校工商管理学专业硕士研究生。他自大二起加入“数字经济与产业互联网创新研究院”校级科研平台,在导师孔敏副教授的指导下,专注于优化模型与优化算法的设计研究。此前,他与导师合作,以第一作者身份在国际知名计算机科学领域期刊《Journal of Industrial Information Integration》上发表了学术论文。