为进一步推动学院教师对深度学习、大模型技术教学、科研工作的开展,加快推动形成新质生产力,提升教师数字技能,培养深度学习、大模型技术师资力量和教师项目研究能力,大数据系老师陈志忠和解进于2024年7月19日-26日参与了“2024暑假全国高校深度学习+大模型技术原理与项目案例实战师资培训班”,本方向培训班由中国联通研究院高级架构师蔡丰龙主讲,采用实用教材及实验环境和实验数据,分享前沿深度学习+大模型技术。
在培训过程中,主讲教师通过一系列精心设计的课程,以“理解透彻,代码实战”为目标,通过形象生动的课程讲授和丰富多样的实战实验设计。主讲教师深入讲解了各种神经网络和深度学习的结构及学习原理,卷积神经网络(CNN)在图像数据中的应用,循环神经网络(RNN)及其变体LSTM和GRU在时间序列数据中应用。另外,介绍了提高模型训练效率和防止过拟合的各种技术,包括激活函数和梯度下降算法的选择,正则化技术等。上述技术均采用了深度学习主流框架TensorFlow和PyTorch实现,并带领大家深入解析了该领域的典型论文和算法实现源代码。在大模型技术方面,深入讲解了大模型技术的底层原理Transformer技术、BERT模型的双向训练机制、预训练与微调策略、分布式训练技术、超参数调整方法、模型评估指标、模型可解释性工具、模型鲁棒性增强技术、知识蒸馏以及模型部署实践。教师讲解透彻、内容可视化强;在激发学习兴趣的同时,切实根据教学内容动手实践,为参训教师今后开设同类课程及实际项目研发提供关键技术支撑。
培训期间,教师们积极参与讨论,与授课教师深入交流。通过讲授具体的技术知识点和项目案例,不仅提升了对深度学习和大模型技术的理解,还掌握了将这些先进技术应用于教育领域的实用技能,获得了将这些技术应用于教育实践以提升教学效率和学生学习体验的能力,为推动教学创新和提升教学质量奠定了坚实的基础。
参与本次培训的陈志忠和解进老师均表示通过本次培训,对深度学习和大模型技术原理不仅有了更深入的了解,还掌握了该技术的实现和应用,学会了如何将这些技术应用到实际教学和科研项目中,切实提升了教师的实战能力。