本周由侯丽博士给大家讲解集成学习框架,介绍了Boosting提升框架的AdaBoost加权模型,Bagging与随机森林等,重点讨论了多样性度量方法,大家重点讨论了多样性增强方法,包括数据样本扰动、输入属性扰动、输出表示扰动、算法参数扰动等。在两级学习的框架下,结合常用的决策树、贝叶斯分类器、随机森林等作为一级分类器,采用深度神经网络作为二级分类器,可以实现异构分类器的级联与集成效果。
自由讨论时,沈来信教授分享了在信用卡欺诈检测中的实验结果,Xgboost>LightGBM>Catboost>随机森林RF>孤立森林,并讨论了训练代码和训练数据集。
图 侯丽博士主持集成学习讨论会
会议中,多位专业老师进行了跨专业的人工智能应用研发讨论,集中在生成式大模型应用基础上,在建筑、艺术的图形、图像、音频、视频等生成徽派特色的产出。在现有图像大模型基础上,采集徽派建筑图像数据,进行徽州建筑特征的标注,构建专有的建筑语料库、竹雕语料库等,通过微调训练得到垂直领域大模型,完成大模型应用的最后一公里。
(会议总结:沈来信)