12月10日,成都东软学院大模型应用与研发中心科研沙龙暨中心第十六场分享会顺利举行。本次沙龙由学校科研部刘轩老师主持,基础教学学院吴明科老师进行主题分享,大模型应用与研发中心相关人员及各学院科研团队骨干教师等参会聆听。本次分享会聚焦于如何通过优化算法与模型架构的深度整合,提升其在智能决策、自动化学习和数据处理等领域的应用效能与发展潜力。
科研部刘轩老师主持沙龙
分享会上,主讲嘉宾吴明科老师以“数学赋能AI:数学优化算法在大模型中的应用”为题进行了深入且生动的分享。吴老师首先介绍了优化算法的基本原理,并通过具体实例,深入浅出地讲解了这些原理在实际应用中的体现。在谈到人工智能中常见的优化算法时,吴老师特别提到了梯度下降法和AdamW算法。他阐述了梯度下降法的基本思想,并重点对AdamW算法进行了介绍。作为一种改进的随机梯度下降算法,AdamW结合了Adam算法的自适应学习率调整和权重衰减的优点,能够更有效地处理稀疏数据和复杂模型。最后,吴老师对今后可能的研究方向作出展望。未来,可以进一步在优化算法迭代公式、损失函数设计、参数初始值确定等方面探索更多的可能。
吴明科老师讲解自适应动量算法
讨论环节后,刘轩老师对本次沙龙进行了总结发言。刘老师对吴老师的深入讲解表示感谢,并强调了数学优化算法在推动人工智能技术进步中的关键作用。吴老师的分享不仅让参会者对优化算法有了更为直观的理解,也激发了大家对算法应用的深入思考,同时也为未来优化算法的研究和应用提供了新的灵感和方向。
分享会现场
本次沙龙在经过了积极且深入的讨论后圆满结束。展望未来,中心将继续致力于搭建高质量的交流平台,定期举办此类活动,进一步推动大模型应用与研发中心的发展,促进学校整体科研实力提升与创新发展。希望未来能够见证更多创新成果的涌现,共同为学校的发展贡献力量。