4月20日晚,我院MBA/MPAcc/MEM“实战前沿”讲座在我校五山校区12号楼301室成功举办。本次特邀主讲嘉宾为聆思科技大模型方案部负责人、方案产品部总经理李璞先生,他以“DeepSeek的核心创新与典型行业应用”为主题展开分享。

 

讲座伊始,李璞先生介绍了DeepSeek如何通过系统性工程创新与开源战略,打破传统大模型依赖算力堆砌的桎梏,以更低成本实现媲美顶尖闭源模型的性能,推动大模型技术从“高岭之花”向“普惠工具”转型。他以通俗易懂的方式与大家交流了DeepSeek所做出的核心创新,并结合典型行业场景分析这些创新带来的变化。

 

在技术层面,李璞先生详细介绍了DeepSeek大模型,包括DeepSeekMoE、DeepSeek V2、DeepSeek V3和DeepSeek R1等节点。他总结了DeepSeek大模型的技术创新主要体现在技术架构革新、训练方法创新和工程优化突破三个方面。在训练方法创新方面,他讲解了纯强化学习(RL)驱动的DeepSeek-R1-Zero,它直接在基础模型DeepSeek-V3-Bas上应用纯强化学习 (Pure RL) 进行训练,如同一个无需例题指导、纯靠“试错”自学成才的模型。此外,他还介绍了模型蒸馏技术,模型在训练过程中能够以新的方式学习和优化。在技术架构革新方面,李璞先生介绍了DeepSeek创新的MOE架构、MLA和MTP,以及DeepSeek的工程优化突破,如突破CUDA瓶颈和低成本训练。

 

在应用层面,李璞先生借助深度思考大模型,重构白电产品竞争力,分析了硬蹭AI的常见问题,如功能冗余性、技术支撑薄弱和溢价与体验倒挂等,并举例说明了不成熟的AI技术强行叠加导致的响应速度、模型效果和推理成本的三难选择。他还通过举例做一个健康空气空调通过对需求进行翻译、模型进行选择来深度剖析DeepSeek将在典型行业如何选择应用。他指出,ToB垂直场景更适合dense模型,而ToC通用场景更适合MoE模型。

 

 

在最后的互动环节中,同学们积极提问,围绕DeepSeek未来的发展方向、技术应用、训练方法、训练成本等关键问题与李璞先生展开了热烈的讨论。通过本次讲座,同学们对DeepSeek的核心创新与典型行业应用有了更深刻的理解,同时也为未来在相关领域的创新应用探索提供了新的思路和方向。