近日,以管理学院数字化工程管理专业本科生陈琼为第一作者的论文pf-smote: a novel parameter-free smote for imbalanced datasets在sci期刊《neurocomputing》(影响因子为5.719)在线发表(https://doi.org/10.1016/j.neucom.2022.05.017),管理学院张忠良副教授为论文的通讯作者。据悉《neurocomputing》是国际知名期刊,被列为中科院sci二区top期刊,ccf-c类期刊。
不均衡数据分类任务是数据挖掘领域重要的研究内容。smote是处理不均衡数据的经典方法,受到广泛关注,但是传统的smote及其改进方法存在两方面的不足:一是性能受制于参数设置,二是合成样本代表性不强易产生过拟合现象。为此,该工作设计了一种新的合成样本生成方法,该方法不需要任何参数设置,也就是具有学习任务自适应能力,并且合成的少数类样本更具有代表性。大量数值实验验证了该方法的有效性和鲁棒性。
“我是从大一上学期进入张老师的本科生科研创新团队的,一开始张老师并没有给我们安排具体的研究方向,而是做了大量的基础训练,包括python和java编程练习、数据挖掘基础理论知识学习、从底层实现经典算法,等等,我们每天都要向张老师汇报总结当天的学习情况,每周都有组会讨论。这个过程其实挺漫长的,张老师也一直在鼓励我们,让我们坚持住,他经常挂在嘴边的一句话是‘大家都是两个肩膀一个脑袋,凭啥他做得出来我做不出来。’”陈琼说道,“在算法实现过程中,遇到数据异常情况时,张老师反复强调一定要做到:异常能定位、错误可复现、问题要解决。张老师非常强调学术规范,他说这是我的第一篇国际期刊文章尤是如此,一定要保证实验数据的准确性,为将来开好头。总之,挺开心的,论文被接受了,非常感谢管理学院设置的导师制,让我有机会在本科阶段就接触到科研项目。”
近年来,管理学院大力推行本科生科研创新能力培养,积极引导本科生科研兴趣,已取得了一系列成果。该论文标志着管理学院本科生科研创新能力培养的又一重大突破。