最近很多大佬问我 DeepSeek,讨论得挺热闹,起初我没打算聊这个,第一是有点蹭热度的嫌疑,第二人家都已经在GitHub开源了怎么实现的把代码下载下来就能看到,第三是几乎从里到外都有人聊过,而且从技术的角度上来说比我专业的多,第四是最近在忙着全网引流训练营和一些新的赚钱挑战,但还是出于粉丝们催更,都想听我来聊聊,那我就简单的从四个角度出发,来聊聊大家最关心的几个问题
【1】DeepSeek是不是套壳亦或者是蒸馏出来的?
先说结论,不是套壳和蒸馏,基础框架还是 Transformer,只是在设计和优化上面做了很多调整,重点放在了提升效率上,比如架构,deepseek采用了一种“专家分工”策略,类似 MoE,把整个系统拆成多个独立单元,训练时让不同单元分配到各自的计算资源上,提高并行能力。推理时,不会让所有模块一起工作,而是只激活一部分,从而减少计算成本,还有很多细则就不一一说了,大家感兴趣可以去看代码,
【2】那为什么做出那么好用的效果成本才花了500多万美元,比Meta便宜了70%多。比OpenAI还便宜了约90%(数据来自网络)
上面数据听着是挺夸张的,但事实没这么简单。虽然设计优化占很大一部分,这个没的说,但现在在国外,训练一个规模达到千亿级别的AI,成本其实并没有传言那么高,注意我说的是现在,不是两年前,DeepSeek 只是把这个成本压缩到了行业平均水平的三分之一左右。Meta 和 OpenAI 之所以花钱多,主要是因为他们在前沿探索阶段,试错成本高,而 DeepSeek 作为后来者,可以直接站在他们的经验上减少不必要的浪费。而且,计算资源这几年价格下降得很快,不能直接用几年前的价格去做比较。咱们换个角度就很清晰了,比如研发一种新药可能需要十年、花费数十亿美元,而仿制药的开发成本低很多,两者成本差异巨大。直接对比比较容易误导
【3】对比ChatGPT有什么优势?南风用什么?
对比ChatGPT有什么优势?站在普通用户的角度上来说最大的优势就是不用魔法就能直接用,目前阶段完全免费且逻辑性较强提问门槛非常低,已经可以剔除提示词的概念去玩了,非常适用于普罗大众,最关键的是deepseek是咱们国内开发的,一些能说的和不能说的深度求索就已经做了控制,这对使用Ai从事文本生产的人来说减少了自我XX的时间成本
但我依然还是习惯用ChatGPT,因为离不开gpts,第二就是用户习惯,这个一旦养成很难去改变,第三我还是喜欢强逻辑,强提示词的交互方式(毕竟我是程序员出身,这个也算是职业病)
【4】现在有多少人通过deepseek赚到钱了?
其实基于deepseek的交互价值变现的之前的ChatGPT甚至kimi豆包都能做,这个就不再聊了,炒冷饭也没啥意思,目前最直观且已经拿到了结果的变现方式还是以卖铲子蹭热度为主(比如教本地部署的,提供本地部署服务的这些淘宝咸鱼都能搜到,还有一个比较爆的点就是为企业部署,亮点对比openai有很多,比如价格低,限制少之类的)
虽如此,依然不妨碍deepseek是nb的,我只是比较理性,自认为比较客观,最后还是一家之言、经供参考~
|