中国人工智能公司DeepSeek昨日晚间在官方交流群中宣布,其开源大模型DeepSeek R1已完成小版本试升级(0528版本),实测编程能力已跻身国际一线水平,部分任务表现甚至优于Anthropic的Claude 4。这一升级虽未迎来万众期待的R2,但其性能提升仍令业界瞩目。

编程能力“炸裂”,代码生成与修复表现突出

据用户实测反馈,新版R1在代码生成、理解和修正方面展现出极强的能力,包括:

  • 网页生成:可快速构建完整的前端页面。

  • 小游戏开发:能生成可运行的游戏逻辑代码。

  • Bug修复:针对复杂的绘图板、图片画廊灯箱效果等代码问题,R1能精准定位并修正错误。

部分测试者表示,R1在编程任务上的表现已超越Claude 4,尤其是在一次性生成可用代码的成功率上,显著优于同类模型。

文本处理能力同样亮眼,风格控制出色

除编程外,新版R1在文本创作方面也有不俗表现,例如:

  • 美食翻译:能结合文化背景提供精准且富有创意的翻译。

  • 脱口秀创作:可生成符合特定风格的幽默段子。

市场反响热烈,API仍保持开放

DeepSeek表示,此次升级API接口和使用方式保持不变,开发者可继续通过官方网页、App或小程序体验新版R1。

此前,DeepSeek R1已在国际大模型竞技场(Arena)中排名全类别第三,与OpenAI的o1并列,并在风格控制类模型(StyleCtrl)中位居榜首。此次升级进一步巩固了其技术领先地位,也再次证明中国AI模型在全球竞争中的强劲实力。

未来展望:R2何时到来?

尽管R1的升级令人惊喜,但不少用户仍在期待DeepSeek R2的发布。目前官方尚未透露R2的具体时间表,但此次R1的优化或许预示着更强大的版本已在路上。

image.png

DeepSeek R1新版现已开放测试,感兴趣的开发者可前往DeepSeek官网体验。




>>>>>>>>玲珑加速器