12月14日上午,王子栋教授应邀参加信息学院IT讲坛第18期讲座,本次讲座的主题是“Deep Learning Limited by Class Imbalance and Small Sample Issues: Challenges and Progress”。讲座由我院李琦老师主持,同时学院党委书记周春儿、副院长姚争为、副书记余洁也出席了此次讲座。学科办、辅导员等相关负责人、以及相关专业教师、众多研究生和本科生都到场参加了此次讲座。此外,此次讲座还在线上进行了同步直播,为未能到场的老师和同学们提供了一场前沿的学术交流机会。
本次讲座深入探讨了深度学习在类别不平衡和小样本问题上的限制和挑战。王子栋教授从背景、研究挑战、研究方法和研究进展四个方面,为我们详细解读了深度学习在这一领域的现状与前景。
在大数据时代,收集高质量标签成为一项艰巨的任务,这也导致了深度学习面临两个问题,即类别不平衡问题和小样本问题。这两个问题在许多实际应用场景中都存在,如医疗诊断、金融欺诈检测、自然语言处理等,对模型的性能和泛化能力构成了严重挑战。
在讲座中,王子栋教授首先介绍了深度学习的背景知识,包括概念、技术、应用和挑战。接下来,王教授引入了三种最新算法,专注于解决类别不平衡和小样本问题:1) 一种新颖的对抗网络,用于少数类数据增强。这种方法通过生成与少数类相似的虚拟样本,增加了少数类的数量,从而提高了模型的性能。2) 一种新颖的子域对齐数据增强方法。这种方法通过对不同子域的数据进行增强,提高了模型的泛化能力。3) 一种新颖的原型辅助对抗网络,用于弱监督学习。这种方法通过利用原型网络提取的特征,对无标签数据进行学习,从而提高了模型的性能。在管道故障诊断中的应用中,这三种算法均表现出色,优于现有算法。最后,王教授总结了这些算法的主要贡献,并探讨了未来的研究方向。他指出,未来的研究将致力于进一步优化算法性能,提高模型的泛化能力,以更好地应对类别不平衡和小样本问题。
在讲座的互动环节,王教授不仅细致的解答了老师和同学们的问题,还通过具体的案例和数据,进一步解释了相关算法的原理和应用。他讲到,选择合适的算法需要考虑数据的分布、任务的性质以及模型的复杂度等因素。例如,对于少数类样本较少的场景,可以使用生成对抗网络等方法进行数据增强;而对于需要同时考虑类别不平衡和小样本问题的场景,可以考虑使用子域对齐数据增强方法或原型辅助对抗网络。同时,评估算法的性能通常需要考虑准确率、召回率等指标,还需要考虑算法的鲁棒性和泛化能力。
本次讲座王教授深入探讨了深度学习在处理类别不平衡和小样本问题上的挑战与限制,以及最新的解决方案和研究成果。王教授的讲解不仅让我们对深度学习的背景知识有了更清晰的认识,还让我们对相关算法的原理和应用有了更深入的了解。相信通过王教授的耐心讲解,大家都能获取到其独特的学术观点和实践经验,为自己的研究工作提供新的思路和启示。
(文/叶列立 彭俊彪 图/叶列立)
版权所有 ©️ 杭州师范大学研究生院 公安备案号:33011002011919 浙ICP备11056902号-1 技术支持:亿校云