学术主页
研究简介

蒋昕玮

我目前聚焦于音乐信息检索与多模态智能方向,尤其关注歌唱与音乐音频理解、情感计算、跨模态表征学习,以及音频与文本/视觉信号的协同建模。

研究兴趣

  • 音乐信息检索与音乐音频理解 关注歌唱情感识别、音乐片段表征、音频特征学习,以及面向音乐内容分析的深度学习建模。
  • 多模态学习与情感计算 研究文本、音频、视觉多模态信号融合中的模态偏差、鲁棒表征与跨模态协同优化问题。
  • 时序建模与序列智能 对 Transformer、时序预测与长序列建模具有持续实践,强调方法在真实任务中的可迁移性。
  • 研究方向聚焦 希望进一步围绕音乐信息检索、音频-文本对齐、多模态情感理解、音乐生成与音乐认知计算展开系统研究。

学术概览

研究主线集中在音乐信息检索与多模态智能交叉区域,当前重点关注歌唱情感建模、音频表征学习、 跨模态鲁棒融合,以及相关方法在音乐理解与情感计算任务中的迁移。

过往工作覆盖音频算法预研、多模态情感分析、时序建模、工具化系统设计与大模型优化, 形成了从理论问题到实验验证、再到工程落地的连续训练路径。

经历与代表性成果

2024.09 - 2024.11 音频算法

广州市乐沃信息科技有限公司 · 歌唱情感检测算法预研

开展歌唱情感检测算法调研、预研设计与验证,参与文档规范、技术调试和需求评审。

音乐信息检索 / 音频理解 / 情感分析
本科毕业设计 多模态学习

基于帕累托优化与信息瓶颈的多模态大模型情感分析研究

设计多模态情感分析训练框架,缓解模态偏差与梯度冲突,并在 CMU-MOSI/MOSEI 上完成验证。

Acc-7 +2.5%,Acc-2 +1.6%,F1 +1.8%
挑战杯终审 工具设计

TimeSeer:跨学科时序任务智能分析工具箱

设计覆盖预处理、训练与评估流程的时序分析工具箱,服务跨学科场景并入围“挑战杯”终审决赛。

时序建模 / 工具化 / 竞赛成果
北京大学合作 时空建模

基于 RasterConv-iTransformer 的全球土壤湿度模式智能反演研究

设计深度学习架构完成多源栅格数据到土壤湿度的高精度反演预测,模型平均 R² > 0.96。

时空序列 / 表征学习
企业合作 大模型系统

面向户籍查询场景的 Text2SQL 优化研究

基于 Qwen-2.5-Coder-32B 完成量化、微调与推理加速,优化自然语言到 SQL 的转换质量与效率。

大模型训练 / 推理优化
代表性成果 竞赛记录

竞赛与音乐技术相关成果

获“挑战杯”终审决赛展示、华为 ICT 大赛昇腾 AI 赛道奖项、全球校园人工智能算法精英大赛二等奖,以及音频作品专项奖二等奖。

竞赛成果 / 音频工程 / AI 应用

研究陈述

我的研究兴趣正逐步收敛到音乐信息检索与多模态智能交叉区域。当前最感兴趣的问题包括: 如何从歌唱与音乐音频中学习更稳定的情感表征;如何缓解音频、文本、视觉等模态在联合训练中的偏差与不平衡; 以及如何将多模态表示学习方法迁移到音乐理解、音乐推荐和音乐生成辅助分析等场景。

从音频算法实习到多模态情感分析毕业设计,我的实践路径已经形成一条较明确的主线: 以真实感知信号为对象,以表征学习与模型鲁棒性为核心,以可验证实验结果和可落地系统实现为目标。 后续希望在音乐信息检索、音频-文本对齐、音乐情感计算和多模态表示学习方向继续深入。