今天早上起来,看到了一个大v的公众号测评,说Deepseek新的V3版本,已经可claude接近了。
难道Claude真输了?这能不赶紧体验一下吗?
体验路径:打开deepseek官网,不要勾选深度思考即可。
测评代码效果
1、来个简单的贪吃蛇游戏。
为了保证测试简单,我们不用结构化提示词,看看对于普通的需求,二者的表现如何?
下面是deepseek生成的,生成是一个python文件。我们可以看到明显的乱码和没有框格。
这个是claude生成的。默认生成的是一个html语句,界面相对来说比较美观。
这一局,还是claude是领先的。
2、来个修改代码的操作。
我们大概有700多行的SQL代码,字段里面有state和count的关键属性。目标是把我的SQL关键词替换掉,还不能影响逻辑。
我们直接丢给两个模型看看效果。
700多行的SQL,deepseek丝毫不怯场。
claude的执行也是ok的。
拿着二者的代码去运行,都无缝通过。
这一局,双方平手!
写在后面的话
总体体验下来,Deepseek-V3这次更新将上下文增加到128k,代码理解能力明显提升了。
不得不承认,我们和Claude相比,还是有差距的,尤其是在像图片识别生成网站效果这类场景中,Claude的表现确实很强。
但是Deepseek也在不断逼近,未来肯定会有更好的表现。感兴趣的可以体验一波了。
海量资讯、精准解读,尽在新浪财经APP
未经允许不得转载:小花科普 » DeepSeek V3新版本实测,Claude又输了?