智能计算平台是黄山学院第三批校级科研平台,平台团队由人工智能、计算机、软件工程等十多位博士、教授组成,主要依托数据科学和人工智能技术,涉及到海量数据采集、多模态数据融合和特征提取、大规模网络计算以及基于图像识别、语音识别和自然语言处理的关键技术。应用在测量理论、数据管理等技术支持下,形成海量实时数据源,并依靠人工智能技术对数据进行可信可靠的应用。
平台主要研究方向:
1)基于遥感数据的应用研究
随着北斗卫星全面组网成功和卫星民用化趋势,北斗卫星测量精度可达厘米级,基于遥感数据的目标检测、与地面WSN组建混合定位网络完成精准定位、道路识别以及河流识别、植被识别、作物识别等,对于农业、渔业、牧业以及城市建设等,都能建立在多尺度卫星图像上的识别、定位和变化检测等。
2)海量数据分析与机器学习核心算法研究
涉及时序数据(交易数据、出行数据、系统日志、多传感器数据等)、半结构化非结构化数据(文本、图像、语音)等,研究多模态数据的多尺度特征提取技术,诸如SIFT、Gabor、小波、HHT、HOG、MFCC、Fbank、word2vec、TFIDF等,以及数据挖掘与机器学习核心算法研究,包括聚类算法、分类算法、关联挖掘、序列挖掘、轨迹挖掘等,还有集成学习、深度随机森林等复合架构的研究与应用实践。
3)深度神经网络模型研究以及在图像、语音和自然语言处理方面的应用研究
深度神经网络(包括CNN、DNN、TDNN、LSTM、TransFormer、ConFormer、Attention等),探索基于多尺度数据融合、特征融合、模型融合的多模态数据融合以及多尺度网络计算的智能分类系统,包括目标检测、图像识别、图像分割、语音识别、方言识别、声纹识别、语音合成、自然语言处理NLP和自然语言理解NLU、知识图谱、多轮对话、智能问答等关键技术的研究与实践。
4)多模态深度网络研究:以图生文、以文生图、视频行为分析等架构研究
图像标题生成是人工智能研究热点,可以让图像快速形成文本描述和关键信息提取,对后期的索引、搜索与匹配提供,把图像的编码与文本标题的编码结合起来训练,利用编码器与解码器架构可以实现。基于解码器架构的看文绘图架构,基于transformer+self-attention的OpenAI、DALL.E架构等完成以文生图任务等。
5)AutoML、神经架构搜索NAS、模型搜索等自动机器学习架构研究
自动机器学习架构(AutoML)快速兴起,无需手动实验的方式快速找到合适的神经网络架构,集多个训练器、搜索算法和已评估模型的模型搜索(Model Search)架构研究,探索多个模型的分布式搜索与装配等。
6)集训练与推理应用一体化平台研究
基于海量数据采集网络,研发数据自动标注、半自动标注方法、特征提取技术,构建集数据导入、数据预处理、训练数据选择、训练数据半自动化标注、特征抽取与选择、识别与分类网络设计、网络模型在线训练、网络模型验证、网络模型推理和应用于一体的机器学习与深度学习平台,研究面向图像、语音和NLP的算法算子层,完成图像类模型训练、语音类模型训练、NLP类模型训练以及多模态模型训练平台等研究,通过不断构建算子层能力,推动人工智能核心能力的提高和落地。
7)基于机器学习算法算子和深度学习网络模型的智能化应用
聚焦应用包括基于遥感图像的目标检测与识别、网络爬虫与知识抽取系统、用户画像与精准推送系统、人脸检测与识别系统、人体动作识别与行为分析系统、基于传感器网络的环境监测与分析系统、基于语音合成的语音播报和语音陪护系统、基于智能交互的语音问答系统、基于OCR与手写体识别系统、基于多模态的知识图谱构建等。
团队重点关注微尺度规模下的海量数据、探测数据、数值仿真与数据绘图技术应用。于2005年开始对探测数据的增长、拟值化处理、数据的孕育等进行研究,成功在WSN基础上提出了ADSN专业网络与数据管理技术理论,并在古民居探测与早期火灾探测上获得应用;海量探测数据管理方案应用到了民居数据采集、文献数据可计算化管理、功能数据的拟合上,对以卫星图像为基础的近87TB村落数据,进行了有效管理,高性能的识别出全球类似“徽州古民居数量接近83万幢”。建立村落早期火灾环境、古民居温度场/湿度场模型、古民居微颗粒分布模型、古民居水致霉变漫延模型、环境木材含量测试模型、人居环境作息多参数模型等基础探测仿真数据库。
团队成员先后发表相关论文60多篇,本科生组成的小组具有16项软件著作权与20多个专利。同时团队主持与完成了国家文物局、文化部科技创新、省级项目等十余个。
智能计算平台:7706实验室;交流QQ:79776969,欢迎有合作需求的老师交流。