本期主题:深度强化学习,鲁棒优化
本期嘉宾:张启超 (中国科学院), 贺喆南 (四川大学), 李亚飞 (郑州大学)
时间:5月12日 12:10-14:30
形式:腾讯线上会议(会议号796-321-855,限100人),B站同步直播
日程安排:
张启超 研究员
演讲时间:12:15~13:000
《基于深度强化学习的自动驾驶预测和决策研究》
摘要:近年来,数据驱动的深度学习和强化学习受到了各领域包括自动驾驶领域的广泛关注。从产业界来看,国内外许多自动驾驶公司如Waymo、Wayve、Lyft、百度等均在积极探索深度强化学习在自动驾驶领域内落地的可能。与此同时,科研界也在这一方面进行了大量的前沿研究和应用探索。总体来讲,针对自动驾驶中的轨迹预测和决策控制问题,深度学习和强化学习存在机遇也面临挑战。本次报告,主要分享团队利用深度学习在自动驾驶轨迹预测和强化学习在自动驾驶车辆决策方面的一些探索类工作和研究进展。
贺喆南 教授
演讲时间:13:00~13:45
《鲁棒进化优化中的若干问题研究》
摘要:工业生产处于开放环境中,多来源多形式的干扰存在于生产制造各个环节,具有边界固定、发生频繁、具体分布难以估计的特点,导致优化问题目标域、决策域、以及模型本身均带有不确定性扰动,需通过鲁棒优化获得在不确定环境下保持一定水平最优性的鲁棒最优解。从鲁棒优化中提炼四个关键科学问题,即“个体性能表示困难”、“模型精度不足”、“种群鲁棒性能和最优性能难以平衡”和“采样过程导致计算量大”。并研究扰动下个体多目标最优性能表示方法、基于列生成框架和进化计算的求解方法、基于种群特性深度挖掘的方法、和动态环境下的适者生存机制用以分别求解上述四个关键科学问题。
在此基础上,针对大范围的不确定性扰动会产生单一模型难以刻画环境特征的问题,将大范围不确定性环境下多目标优化问题凝练成一组有代表性的离散资源优化场景,提出多场景优化问题。研究基于知识迁移机制的多场景优化算法,实现不同场景间的协同增效以提升收敛速度,获得适于整个不确定性环境下的最优解。
李亚飞 教授
演讲时间:13:45~14:30
《面向订阅/发布共乘服务的实时任务分配方法研究》
摘要:共享出行能为失灵的城市交通系统提供有效解决方案。近年来,以共乘出行为代表的新型共享出行模式,在不增加城市基础运力负荷的前提下,利用移动互联网和大数据等技术,将分散的出行需求与闲置的车辆资源集聚并进行优化配置,通过多人共乘的出行方式进行跨时段、跨地区的运力动态调配,有效提升了城市运力运营效率,具有巨大的经济与社会价值。本报告讲述了一种新的基于订阅/发布模式的顺风车共乘服务,聚焦解决订单动态流入平台时司乘推荐方案的实时更新效率瓶颈。本报告介绍了两种基于该订阅/发布共乘服务框架的高效混合网格索引和双层缓存机制,提出了若干基于学习优化策略的高效解决方案,极大地提升了订阅/发布共乘服务的计算效率。
版权所有 ©️ 杭州师范大学研究生院 公安备案号:33011002011919 浙ICP备11056902号-1 技术支持:亿校云