多家券商官宣部署DeepSeek模型,看重高性能、低成本。
本文自南都·湾财社。
采写 | 南都·湾财社记者 吴鸿森
编辑 | 王琦璋
春节期间, DeepSeek席卷全球,掀起了中国AI的浪潮。
据悉,在春节期间,DeepSeek在全球140多个国家的苹果App Store下载排行榜中登顶,成为现象级AI应用。春节后,DeepSeek的暖风带动相关概率股大涨,形成A股上涨驱动力。
南都·湾财社注意到,在应用市场、A股市场之外,多家券商已经抢先试水,官宣接入DeepSeek模型,旨在提升智慧金融服务。
看重其“高性能、低成本”特性
2月6日晚,国金证券、国元证券、华福证券等中小券商率先通过官微宣布正式接入DeepSeek模型,完成本地部署。据公开渠道,上述三家券商为券商行业内首批次正式使用DeepSeek模型的机构。
华福证券表示,已成功接入DeepSeek V3和R1两款大模型产品,主要赋能员工知识问答、辅助软件研发、辅助制定营销方案、增强客户陪伴等业务场景。
国金证券则表示,已完成DeepSeek大模型的本地化部署测试。对于应用场景,国金证券强调道,旨在将其应用于信息检索、文档处理、行业研究及市场研判等多个场景,并计划未来进一步拓展至智能服务、风险管理、投资分析等核心业务领域,全方面推动公司智能化升级,为投资者创造长期价值。
国元证券表示,近日已完成该模型在金融场景的本地化部署及适配性测试,计划将其深度整合至自主研发的智能服务平台“燎元智能助手”中。DeepSeek-R1将赋能“燎元智能助手”实现更精准的语义理解与多轮对话能力,覆盖合规问答、业务办理指引、知识查询等场景,加速推进证券服务智能化转型。
从赋能场景来看,券商们的主要目标是加速数字化转型,完善“智能化”服务。值得一提的是,对于为何接入DeepSeek,上述券商均指向了“高性能、低成本”。
据公开资料显示,DeepSeek-V3和R1的训练成本仅为560万美元,远低于行业平均水平,且模型架构完全开源,支持私有化部署,有效保障了数据安全。
国金证券表示,DeepSeek是由深度求索公司推出的高性能、低成本开源大模型,其最新版本DeepSeek-V3和R1在性能上已媲美OpenAI的GPT-4,且部署成本显著降低。
国元证券则认为,DeepSeek-R1通过算法创新显著降低模型训练与推理成本,其“能力提升、价格下探”的特性将加速AI在垂直行业的普惠化进程,尤其在金融高数据密度场景中,有望催生“AI+运营”、“AI+产品”、“AI+资管”、“AI+投研”、“AI+合规”等创新商业模式。
DeepSeek引领AI浪潮,
多家券商均一致看好
2月6日,A股盘面上,DeepSeek概念股全天大涨,安凯微、青云科技、优刻得等10余股涨停。DeepSeek的浪潮已然掀起了A股市场的上涨热潮。
他同时预计,春节后AI基础设施和应用端将迎来上涨行情,带动科技成长板块整体上扬。
华泰证券表示,DeepSeek的成功引发全球科技市场热论,也成了假期期间最热门的投资主题。DeepSeek主要创新是通过在预训练阶段加入强化学习,显著降低了当前AI大模型的训练和推理成本,ASIC芯片、AI应用、端侧等方向受益,降本增效成为A股/港股科技公司估值修复的主要推力,关注A股AI应用、港股恒生科技等方向。
值得一提的是,中信建投证券首席策略官陈果发表了对AI领域投资的思考,并分享了各版本模型对硬件的要求:普通笔记本和台式机仅配备CPU,仅能勉强运行DeepSeek-R1-1.5B和7B,但响应速度慢,缺乏实用性。英伟达RTX 4090可较快运行DeepSeek-R1-32B,但在处理70B版本时表现不佳。
此外,陈果表示,中小模型如1.5B、7B和14B适合简单的微信交流场景,但无法解决复杂问题;32B模型具备深度思考能力,适用于服务客户的微信交流。671B完整版及70B模型需要企业级显卡如A100或H100支持,不适合消费级硬件。云端部署虽可行,但存在数据隐私问题。