广州市乐沃信息科技有限公司 · 歌唱情感检测算法预研
开展歌唱情感检测算法调研、预研设计与验证,参与文档规范、技术调试和需求评审。
音乐信息检索 / 音频理解 / 情感分析我目前聚焦于音乐信息检索与多模态智能方向,尤其关注歌唱与音乐音频理解、情感计算、跨模态表征学习,以及音频与文本/视觉信号的协同建模。
研究主线集中在音乐信息检索与多模态智能交叉区域,当前重点关注歌唱情感建模、音频表征学习、 跨模态鲁棒融合,以及相关方法在音乐理解与情感计算任务中的迁移。
过往工作覆盖音频算法预研、多模态情感分析、时序建模、工具化系统设计与大模型优化, 形成了从理论问题到实验验证、再到工程落地的连续训练路径。
开展歌唱情感检测算法调研、预研设计与验证,参与文档规范、技术调试和需求评审。
音乐信息检索 / 音频理解 / 情感分析设计多模态情感分析训练框架,缓解模态偏差与梯度冲突,并在 CMU-MOSI/MOSEI 上完成验证。
Acc-7 +2.5%,Acc-2 +1.6%,F1 +1.8%设计覆盖预处理、训练与评估流程的时序分析工具箱,服务跨学科场景并入围“挑战杯”终审决赛。
时序建模 / 工具化 / 竞赛成果设计深度学习架构完成多源栅格数据到土壤湿度的高精度反演预测,模型平均 R² > 0.96。
时空序列 / 表征学习基于 Qwen-2.5-Coder-32B 完成量化、微调与推理加速,优化自然语言到 SQL 的转换质量与效率。
大模型训练 / 推理优化获“挑战杯”终审决赛展示、华为 ICT 大赛昇腾 AI 赛道奖项、全球校园人工智能算法精英大赛二等奖,以及音频作品专项奖二等奖。
竞赛成果 / 音频工程 / AI 应用我的研究兴趣正逐步收敛到音乐信息检索与多模态智能交叉区域。当前最感兴趣的问题包括: 如何从歌唱与音乐音频中学习更稳定的情感表征;如何缓解音频、文本、视觉等模态在联合训练中的偏差与不平衡; 以及如何将多模态表示学习方法迁移到音乐理解、音乐推荐和音乐生成辅助分析等场景。
从音频算法实习到多模态情感分析毕业设计,我的实践路径已经形成一条较明确的主线: 以真实感知信号为对象,以表征学习与模型鲁棒性为核心,以可验证实验结果和可落地系统实现为目标。 后续希望在音乐信息检索、音频-文本对齐、音乐情感计算和多模态表示学习方向继续深入。