2025年3月13日,人工智能系列读书班活动迎来了2025年第四场报告会,毕津滔博士做了“半监督学习”的研究内容分享,先介绍了针对未标注样本的主动学习、半监督学习和直推学习,然后分析了生成式方法中的高斯混合模型、混合专家模型以及朴素贝叶斯模型,半监督SVM中的TSVM以及图半监督学习中的标记传播算法,最后讨论了基于分歧的方法,包括协同训练算法、约束k均值算法、多视图学习等:
图 毕津滔博士主持“半监督学习”讨论会
自由讨论环节,大家讨论了多视图学习、多模态学习,模态对齐,协同训练方法等,半监督学习里的混合专家模型,就是当前Deepseek等大模型采用的MOE技术,半监督学习在很多领域都是非常实用的;又讨论了当前大模型存在的问题,一个是幻觉问题的解决(高质量标注数据、模型微调、知识库、知识图谱等),以及大模型的预测下一个token的设计模式,对精准分类任务还是存在问题,应该结合有标注的高质量数据,对未标注的数据进行有效的自动标注,逐步形成高质量数据的筛选与标注,完成分类任务的精准化;最后又讨论了DeepSeek+Text-to-CAD、OpenSCAD、智能体等专业领域软件结合的计划等。
(总结:沈来信)