Claude 3.7 Sona 的崛起

昨天,Anthropic 终于发布了万众期待的 AI 模型——Claude 3.7 Sona,这款 AI 让程序员们又惊又喜。发布公告在网络上引发热议,视频下的置顶评论幽默地表达了大家的期待:

“大家一直在等这个视频!”

一位以风趣且深刻见解著称的 AI 评测者承认,他已经花费了数百万个 token 进行测试。他的评价?

Claude 3.7 Sona 的崛起_第1张图片

Claude 3.7 真的猛,完全不一样,绝对封神,毫无夸张,真的真的。

这一版本超越了前代产品,提升了代码能力,并引入了一种受 DeepSeek R1 和 OpenAI 模型启发的“思考模式”。但最让科技界震惊的是 Claude Code 的推出——一个命令行界面(CLI)工具。该工具允许开发者在项目中无缝编写、测试和执行代码,形成一个无限循环的反馈流程。一些人认为,这甚至可能完全取代人类程序员。

编程圈瞬间炸锅。开发者纷纷感叹:

“完了,我们没了。”

为了验证这些说法,一位专注于 AI 领域的知名科技博主决定对 Claude 3.7 Sona 进行测试。


AI 统治编程界:事实还是炒作?

2025 年 2 月 25 日,这位博主研究了 Anthropic 近期关于 AI 对劳动力市场影响的研究。尽管程序员仅占全球劳动力的 3.4%,但 AI 相关查询中竟有 37% 涉及数学和编程。尽管 AI 还没有正式取代人类程序员,但它已彻底颠覆了 Stack Overflow,使人们不再那么依赖人工交流来解决问题。

衡量 AI 在 Web 开发领域实力的一个可靠标准是 Web Dev Arena 排行榜。Claude 3.5 之前已与顶级模型并驾齐驱,而 Claude 3.7 彻底碾压竞争对手。它号称能够解决 70.3% 的 GitHub 真实问题,如果属实,这将改变整个行业格局。

https://web.lmarena.ai/leaderboard

Claude 3.7 Sona 的崛起_第2张图片

这位博主决定亲自测试 Claude Code。该 CLI 工具仍处于研究预览阶段,可通过 npm 安装。然而,问题来了:

Claude 3.7 很贵。

它的价格比 Gemini Flash 和 DeepSeek 等模型贵 10 倍以上,每 100 万个输出 token 的价格高达 15 美元。


测试 Claude Code

安装 CLI 后,博主发现了几个可疑的细节:

  • Claude Code 的文本样式和一个名为 SST 的开源工具惊人地相似。
  • 它的 logo 似乎抄袭了一位作家 库尔特·冯内古特(Kurt Vonnegut) 的奇怪手绘作品。

尽管如此,他还是继续进行了测试。

测试 1:生成随机姓名

Claude Code 成功创建了一个基于 Deno 的随机姓名生成器,甚至自动生成了测试文件来验证其正确性。得益于强类型语言和测试驱动开发,AI 能够自我检查并改进代码。这是 AI 辅助编程的一大进步。

测试 2:开发复杂的 Svelte UI

博主让 Claude 生成一个可视化音频波形的前端 UI,涉及 TypeScript 和 Tailwind CSS。Claude 了解这些技术,但最终未能正确实现。

这次测试花费了 0.65 美元,他开玩笑说:

“这笔钱买个鸡蛋或香蕉可能更划算。”

测试 3:端到端加密

最近,由于政府压力,苹果被迫在英国停止端到端加密。博主想用 Claude Code 编写自己的加密应用。但和之前的 AI 模型一样,Claude 3.7 仍无法生成可用的加密代码。更糟糕的是,他因为越来越依赖 AI,甚至已经 无法手动调试 代码了。


最终评价

Claude 3.7 确实很强,但 远非完美。它在前端开发和调试方面表现出色,但在加密等关键后端任务上仍然欠缺。此外,它的 高成本 让许多开发者望而却步。

不过,如果你想比以往更快地构建应用,可以试试 Convex——一个与 AI 代码无缝集成的 开源响应式数据库。

你可能感兴趣的:(人工智能,claude,sonet)