2024年5月27日,信息工程学院联合信息技术产业学院于学术报告厅成功举办校庆20周年系列学术报告会之人工智能通用大语言模型主题讲座。此次报告会我院特邀了武汉理工大学计算机与人工智能学院熊盛武教授作为主讲人,全院教师和学生代表参加讲座。
熊教授首先深入介绍了人工智能领域的前沿应用,着重讲解了智能通用大模型的发展历程和通用大模型理论技术分析,特别是OpenAI开发的GPT-4.0模型。他在报告中展示了该模型在自动翻译、智能客服、文本生成等领域的卓越表现,并重点强调了该模型在语言生成和理解方面的创新。
熊教授分析了从“小模型”到“大模型”转型的趋势,并深入探讨了ChatGPT成功背后的机制,包括有监督微调、奖励模型训练和强化学习的综合应用。他还强调了高质量数据、有效提示设计以及正向反馈循环对于模型持续改进的重要性,并指出了通用大模型在实际应用中的巨大潜力与面临的挑战,如可解释性、结构优化及偏见问题。
熊教授最后介绍了在通用大模型项目中,如何运用迁移学习定制特定领域知识体系,以及通用视觉对话模型的研发,后者能够跨越不同场景理解图像内容并做出回应。通过建立评测体系和深入大模型编程研究,熊教授团队正推动着大模型在多领域的广泛部署与效能提升。
本次学术报告会为师生们提供了一个深入了解人工智能通用大模型的机会,激发了他们对人工智能研究的热情,同时也推动了学院在人工智能领域的发展和学术交流。