DeepSeek V4全量发布倒计时,国产模型还能给我们什么惊喜?
4月的AI圈,除了大厂们的密集发布,还有一个「待爆」的消息:DeepSeek V4要来了。
据内部人士透露,梁文锋在内部沟通中首次明确,DeepSeek V4计划在4月下旬正式发布。这个时间点,正好卡在五一假期前——既能赶上4月的发布潮尾巴,又能给五一期间的舆论发酵留足时间。
说实话,我对DeepSeek这家公司一直很好奇。
不是因为它的技术有多领先——虽然V3确实很强——而是因为它的「非典型」路径。当所有大模型公司都在卷参数、卷算力、卷融资的时候,DeepSeek在做什么?它在卷「效率」。
V3的训练成本是557万美元。这个数字放在硅谷,可能只够OpenAI烧几天的。但DeepSeek用这点钱,训练出了一个在多项基准测试上比肩GPT-4o的模型。这种「花小钱办大事」的能力,才是它真正可怕的地方。
现在V4要来了,大家最关心的问题当然是:这次能带来什么突破?
根据目前泄露的信息,V4主要在三个方向发力:
第一,推理能力。不是简单的「回答问题」,而是「复杂问题拆解+多步骤推理」。简单说,就是让AI更像一个会思考的人,而不是一个会检索的机器。
第二,代码能力。V3的代码能力已经很强了,但V4据说要「专门优化」。这意味着什么?意味着DeepSeek要把开发者群体作为核心用户来服务。这个策略很聪明——开发者是最挑剔也是最有影响力的用户群。
第三,多模态。文本、图像、代码,三者要能无缝切换。这不是什么新概念,但做好很难。如果V4真的能在这个方向上有实质性突破,那它就不仅仅是「国产之光」了,而是「全球顶尖」。
但我最期待的,其实不是技术本身,而是DeepSeek会不会继续它的「价格屠夫」路线。
V3的API定价是每百万token几毛钱,直接把行业价格打到了地板上。V4会怎么做?是继续亏本换市场,还是开始盈利?这个问题的答案,可能预示着国产大模型的商业化路径。
还有一个悬念:V4会不会开源?
V3是开源的,这也是它能在开发者社区快速建立口碑的关键。但V4会不会延续这个策略?开源意味着技术透明,但也意味着竞争对手可以低成本复制。这对DeepSeek这样的创业公司来说,是个艰难的选择。
我的猜测是:V4大概率会开源,但会有一个「延迟窗口」——先给API服务抢市场,过几个月再开源模型。这样既能保持开发者的期待,又能保证商业收入。
最后说个有趣的细节。DeepSeek的办公室在杭州,离阿里不远。但每次大厂发布新产品,DeepSeek总是「后发制人」——不抢首发,但抢「口碑逆转」。这种「慢半拍但更扎实」的风格,和梁文锋本人的性格据说很像。
V4能不能再次让我们「哇」一声?我觉得可能性很大。不是因为DeepSeek有多强,而是因为整个国产AI生态,已经到了「量变引起质变」的临界点。
你觉得V4最应该提升什么能力?推理、代码、还是多模态?