OpenAI 为什么要收购 Windsurf?

OpenAI

这几天最平静的新闻莫过于OpenAI斥资30亿美元收购Windsurf的消息。这并不是有史以来最大的私人收购案–几个月前,谷歌以 300 亿美元收购了 Wiz–但老兄,这也算得上是大手笔了!30 亿美元是初创企业创始人梦寐以求的退出方式。尤其是对于一家成立仅 2 年、当前品牌推广仅 5 个月的初创公司来说。

我想大多数人都不知道 Windsurf 是什么,这很公平,因为它的用户太少了,当你试图在谷歌上搜索相关信息时,你会得到关于这项运动的数据。

 

也许这是不公平的,据说该公司有超过一百万的用户。但我对这样的数字总是有点怀疑。一个每天都使用 Windsurf 的人和一个安装了这个工具玩了五分钟就扔掉的人显然是两类人。在私营公司工作的好处之一就是容易被忽视。据我所知,只有一个人使用 Windsurf,而且我也只是有点了解他,因为他是我在三藩市的一个家庭聚会上认识的。

如果你不熟悉 Windsurf,你可能知道它以前的名字 Codeium。如果你不熟悉 Codeium,你可能知道它的主要竞争对手,一家叫 Cursor 的公司。如果你不知道 Cursor 是什么,a) 你可能知道 GitHub Copilot 是什么,b) 你是怎么找到我的博客的?

 

元素周期表

所有这些产品大致都属于 “面向软件工程师的人工智能工具”。它们的外形也基本相同,都是将人工智能模型直接集成到编码工作流中。传统上,它们在三个粒度级别上运行:

  • 自动完成。当你输入时,人工智能会向你推荐余下的行或函数,你通常只需按下一个按钮即可接受。
  • 侧边栏问答。代码窗口本身会集成一个侧边栏,你可以要求模型修改一些文件。你会得到一个差异,然后可以选择应用或修改。
  • 代理流。虽然 “代理 ”一词的含义还不够明确,但在人工智能编码领域,该词一般指 “一个人工智能模型在整个代码库中循环运行,通常以一个非常模糊或高级的提示作为起点,并配有编写、运行和分析代码及计算机系统的工具”。

不同公司的目标是在不同的垂直领域做到一流。有些公司擅长自动完成(Copilot),有些公司擅长代理流程(Claude Code)。有些公司的目标是成为最适合非技术人员的公司(Bolt 或 Replit),有些公司则是最适合大型企业的公司(Copilot)。尽管如此,所有这些 “差异化 ”最终也只能带来 1-2% 的产品差异。事实上,这些工具的用户体验和核心功能在本质上是完全相同的,这一点我怎么强调都不为过。

光标截屏。这已成为 vibe 编码的 “典型 “用户体验–一个集成了聊天功能的侧边栏,可以调用工具并直接使用差异更改代码。

就在两年前,这些工具还被贬义地称为 “GPT 封装器”,因为它们实际上并没有在模型层上展开竞争,而是允许用户在任何大语言模型(LLM) 提供商之间进行选择和切换。为了强调这些人工智能代码助手的互换性,我使用了一个更鲜为人知的工具 Avante,它是一个完全免费的开源 neovim 插件。它的功能与所有其他工具相同。我喜欢它是因为我不必离开 vim。

但是,这些工具的相似性并不能抹杀它们改变游戏规则的作用。一旦你习惯了人工智能驱动的编码方式,就再也回不去了。所有这些产品的真正问题在于,它们太容易被垂直化。任何人只需稍作改动,就能针对某个细分市场推出一个 Windsurf 版本,而且非常容易实现–我之所以使用 Avante,完全是因为它支持 vim。这意味着,随着越来越多的竞争者和免费替代品进入市场,即使 “程序员 ”的数量在增加,这些公司的可寻址市场也可能随着时间的推移而下降。2 事实上,尽管我喜欢 Cursor 背后的独创性(它确实是当前人工智能编码范式的先驱),但我曾公开说过,从长远来看,它们的机会渺茫。尽管 Cursor 拥有显著的先发优势,但他们没有护城河,也没有粘性。与人工智能市场的其他产品一样,转换成本仍然极低,当你可以使用免费版本或有更好企业支持的版本时,根本没有理由使用 Cursor。3 Cursor 甚至没有自己的平台,它只是 VSCode 的一个分叉。我个人认为,他们唯一的长期退出机会就是被微软收购,但随着萨蒂亚将更多资源投入到已经是 VSCode 原生的 Copilot 上,将其作为真正竞争对手的可能性似乎越来越小。

所有这一切都使 Windsurf 30 亿美元的价格显得高得吓人。与 Cursor 相比,Windsurf 的用户更少,成立时间更短,品牌知名度更低,未来发展前景也越来越渺茫。它没有与 VSCode 绑定,我想这是一个优点。但这也引出了一个问题:OpenAI 究竟为什么要支付这么多钱?

从 OpenAI 的财务状况来看,这一点尤其奇怪。聪明的观察家们已经发现了谷歌在这一领域的固有优势,我早在 12 月份就公开指出了这一点,两周前我又进一步指出了这一点。为了在竞争中立于不败之地,OpenAI 需要加强计算能力和数据获取能力。但是,OpenAI 与之前的赞助商微软公司之间曾经辉煌的关系已经出现了明显的裂痕。这基本上迫使该公司向软银(没错,就是那个软银)寻求额外资金。

来自软银背后的天才头脑,史上最伟大的幻灯片。

诚然,OpenAI 成功获得了 400 亿美元的投资,而且这也是私营公司有史以来筹集到的最大一笔资金。但他们的对手谷歌是全球最有价值的公司之一,而且利润丰厚。这是一个可以与之抗衡的强大财力。

更糟糕的是,目前还不清楚 OpenAI 是否真的有 400 亿美元可花–到目前为止,他们只准备了 100 亿美元,其余的由软银持有,但条件是 OpenAI 在今年年底前成为一家盈利公司。

很明显,Windsurf 不会帮助 OpenAI 获得更多计算资源。也许 Windsurf 正在为 OpenAI 提供数据访问权限?当然也有可能是这样–不过这也让我不禁怀疑,如果 OpenAI 不再能够访问 GitHub,那么他们与微软的关系会变得多么糟糕,而 GitHub 的代码量肯定比 Windsurf 能够提供的代码量要少得多。

另一种可能是,这完全是一场长期的分销游戏,类似于 Facebook 收购 WhatsApp 或 Instagram。人们批评这些交易价格过高。OpenAI 可能认为,Windsurf 将成为人们访问 GPT 模型的皇冠上的明珠。这有一定的道理–OpenAI 也宣布了一个社交媒体项目,很可能也是为了保持与独特数据源的联系,同时提供更多的原生方式来改善分发和 “商品化补充”。

但他们在 Windsurf 上不可避免地会遇到的问题是,GPT 在编程方面并不是同类产品中最好的。每个使用 Windsurf 的人几乎都在使用 Claude 或 Gemini。尽管 “GPT wrapper ”这个词总是带有侮辱的意思,但实际上,它是一个巨大的桌面桩功能,能够包裹许多不同的大语言模型(LLM)提供商。正是这种灵活性,让 Windsurf 这样的公司能够在机器学习浪潮中乘风破浪,并得到其他所有人的投资支持。毕竟,只有当克劳德突然变得非常擅长编程时,光标公司才真正起飞了。如果 Windsurf 最终只能与 GPT 绑定,那么它的许多用户可能会离开这个平台,原因很简单,因为它现在是一个更糟糕的平台。但如果没有任何供应商锁定,我们又回到了原点–这有什么意义呢?

我个人不明白。也许比我更聪明(或比我更有关系)的人能帮我弄明白。但就目前而言,我认为这种特殊的检查尺寸是人工智能市场目前过于火热的一种表现。

谷歌

过去几天里另一个平静的消息是,人们恍然大悟,原来过去是如此的平静。过去两周,OpenAI 发布了 3 款新产品:o3、o4-mini 和 GPT 4.1,Meta 和 Grok 也分别发布了新的 Llama 4 和 Grok-3。然后……什么都没有。什么都没有。在过去的几个月里,这样的发布日程表会成为头条新闻。炒作的列车应该以惊人的速度前进。但与我的预期相比,什么都没有。

原因显而易见:谷歌仍处于领先地位。看看这两张图表

 

尽管这份图表仅发布了两周,但它已经过时了。

前者是 LMSYS 聊天机器人领域的现状;后者是聊天机器人领域的性能与价格的对比图。大跌?没有标题,因为没什么可写的。“OpenAI夺得亚军 “无人问津!

现在写 “普遍共识 ”还为时尚早,因为 OpenAI 的模型几天前才发布。值得称赞的是,这些模型在大语言模型(LLM) 的许多基准测试中都名列前茅。但到目前为止,反响非常冷淡,很多人都在说类似的话:

 

 

尽管一些新的 OpenAI 模型相当强大,但它们实在是太贵了,而且速度太慢,没有足够的额外能量。

关于谷歌发布的 Gemini 2.5,我已经写过很多文章,它很快就成为了几乎所有事情的首选模型。但我最初并没有注意到,谷歌在性价比曲线上对其机型进行了多大程度的强化。直截了当地说:在每个价位上,最好的机型都是谷歌机型。

这还不是全部。我曾提到有传言称,谷歌已不允许出版新产品:

公司出版政策的变化之一是,在发布与生成式人工智能相关的 “战略性 ”论文之前,将有六个月的禁发期。两位知情人士表示,研究人员通常还需要说服几位员工相信发表论文的好处。

谷歌显然也开始向研究人员提供极为优厚的竞业禁止协议,宁愿让他们在工资单上无所事事,也不愿让他们去竞争对手那里泄密:

前GoogDeepMinder员工南多-德-弗雷塔斯(Nando de Freitas)最近在X网站上发表文章称,谷歌正在利用激进的竞业禁止条款和延长的通知期。在飞速发展的人工智能世界里,这与在最前沿领域工作的时间相距甚远。

最后,谷歌继续在 GCP 上发布和改进其 TPU 产品,为他们提供了从人工智能热潮中获利的另一种方法–即使他们不能在模型上获胜,也可以通过提供底层硬件获胜。

几乎没有大张旗鼓的宣传,我们一觉醒来就看到了谷歌主导的人工智能格局。我过去曾对桑达尔提出过批评,但我不得不佩服他–有时候,炫技真的只是为了分散注意力,而不是执行缓慢但精确的战略7。7 谷歌现在显然已经进入了备战状态,他们正在毫不留情地挖角员工,同时试图尽可能地关闭自己的商店。整个人工智能行业对谷歌的亏欠比其他任何组织都要多。目前还不清楚,在与谷歌的研究切断联系后,该行业还有多少其他参与者能够生存下来。此外,面对司法部持续不断的反垄断诉讼,这种情况还能持续多久也是个未知数。关于这一点,我们将在另一篇文章中继续讨论。

最后一个想法。我一直是资本主义和自由市场的坚定捍卫者,尽管这在我的特定社交圈中历来不受欢迎。观察大语言模型(LLM)市场,我不禁感到非常平反。在过去的 5 年里,尽管模型质量直线上升,但每个代币的成本却在无情地降低。科技巨头之间残酷而惨烈的竞争只为普通消费者留下了财富。在另一个世界里,所有这一切的价格都非常高,只有最富有的企业才能获得 “GPT 许可”,或者政府最终将所有最好的人工智能技术据为己有。这样的世界客观上会很糟糕–不仅大多数人无法获得技术,创新的兴趣和能力也会大大降低。看看谷歌吧,它终于像一头猛兽一样从沉睡中崛起,再次向世界展示了创新的意义。

Apple

既然我们一直在谈论没有发生的事情,我想谈谈最后一个值得注意的缺席:苹果公司到底去哪儿了?

我反复说过的一点是,大语言模型(LLM) 市场具有强烈的赢家通吃效应,市场中的参与者在很大程度上依赖于对科学家、计算和数据的获取。苹果公司是一家非常富有的公司,因此他们获得科学家的帮助不成问题。但在后两方面,他们似乎都遇到了很多问题。

在计算方面,苹果似乎有点自寻烦恼?纽约时报

人工智能的绊脚石始于 2023 年初。五位知情人士称,负责监督这项工作的詹南德雷亚先生向公司首席执行官蒂姆-库克(Tim Cook)寻求批准,购买更多的人工智能芯片,即图形处理器(GPU)。这些芯片可以同时进行数百次计算,对于构建人工智能系统(如聊天机器人)的神经网络至关重要,这些系统可以回答问题或编写软件代码。

这些人说,当时,苹果公司的数据中心拥有约 5 万个 GPU,这些 GPU 的使用时间已超过五年,远远少于微软、亚马逊、谷歌和 Meta 等人工智能领军企业当时购买的数十万个芯片。

这些人说,库克先生批准了一项将团队的芯片预算增加一倍的计划,但苹果公司的财务主管卢卡-马埃斯特里(Luca Maestri)将增加的预算减少到了一半以下。马埃斯特里鼓励团队提高现有芯片的效率。

其中两人说,缺乏 GPU 意味着开发人工智能系统的团队不得不向谷歌和亚马逊等供应商谈判数据中心的计算能力。英伟达(Nvidia)生产的领先芯片需求量如此之大,以至于苹果公司在部分人工智能开发中使用了谷歌生产的替代芯片。

这至少解释了为什么他们一直没有推出像样的机型。从轶事来看,苹果显然拥有数据中心,但他们并不像谷歌/微软/亚马逊那样是云计算提供商,而谷歌/微软/亚马逊曾在不同阶段直接为 DeepMind/OpenAI/Anthropic 提供支持。因此,苹果在整个芯片领域的起步远远落后于其他公司。或许,尝试加倍提升自己独特的芯片能力具有某种战略意义–或许可以像谷歌在 TPU 上所做的那样–但这实在是太慷慨了。更明显的答案很简单: 苹果公司吝啬,一分钱一分货。因此,这家在移动技术浪潮中占据主导地位的公司,在人工智能浪潮中几乎毫无建树。

在数据方面,苹果无疑是自食其果。在一个数据囤积者横行、信息安全公然受到漠视的环境中,苹果公司以用户隐私的坚定捍卫者自居。他们以此为品牌!他们为此投放广告!

 

这一切在几年前都是有道理的,当时数据本身的用处更值得怀疑,而且苹果完全控制了硬件堆栈。苹果在嘲笑谷歌的同时,也让 Meta 在广告政策上吃了大亏。

但现在,数据几乎成了深度学习模型的燃料。更糟糕的是,基本上没有办法避免通过模型泄露数据!人们一直都能让模型直接重现训练数据!谷歌或多或少地避免了使用任何训练数据,因为他们可以,他们已经索引了整个互联网。Meta、xAI、OpenAI 和 Anthropic 都使用公共数据进行训练–前两者来自其社交媒体平台上的公共帖子,而这四种数据都来自对版权法极其可疑的蔑视。

与此同时,苹果公司也遇到了谷歌在废除 “不作恶 ”格言时遇到的同样问题。

“Don’t be evil “有很多含义,对其含义的解释也众说纷纭。但有一点是没有异议的:它很难去掉。谷歌的高管们最终对 “不作恶 ”的座右铭感到后悔,因为无论谷歌做什么,他们都会被人指责。“我以为你说过你不会作恶”,网络评论者会冷嘲热讽地说。他们甚至因此被起诉!

苹果公司也是如此。要么他们使用自己掌握的用户数据,冒着品牌严重受损的风险,而 FAANG 的其他公司肯定会利用这一点;要么他们在人工智能竞赛中自取其辱。实际上,这与其说是一场竞赛,不如说是一场全面厮杀,而苹果在这场厮杀中背负着双手。

到目前为止,他们采取的是 “残局 ”的方式。他们试图通过直接购买他们想要训练的数据的版权许可来解决数据访问问题,但是,拜托,训练数据远远不够。

对苹果公司来说,最糟糕的情况是他们决定延迟使用用户数据。在这种情况下,苹果既要承担品牌风险,又要远远落后于其他人。不过,这种情况似乎会越来越多,因为我实在无法想象苹果真的会退出整个人工智能竞赛。

所以是的。总之,这几周人工智能很平静。

本文文字及图片出自 Tech things: OpenAI buys Windsurf, Google retains its lead, and where the hell is Apple?

你也许感兴趣的:

共有 209 条讨论

  1. 为什么 OpenAI 不能编写自己的 Windsurf/Cursor 竞争对手?(严肃的问题)。

    OpenAI 是一家不断寻求产品化的技术公司(ChatGPT、Sora、Dall-e),他们一直非常善于创造产品兴趣并将其转化为收购。集成开发环境要比聊天应用复杂得多,但考虑到他们拥有数十亿美元的资金和对开发者工具的熟悉程度,他们完全可以利用自身的技术进行下层开发。尤其是考虑到其中一些工具是由小型团队打造的(Cursor 有多少,10 个人?),这是否就像 Google 和 Facebook 默默承认他们无法再 “打造和发展”,而需要通过收购来推动增长?

    1. 我认为没有人比我更适合回答你的问题了,因为我在过去 3 年里一直在开发 IDE 技术,而这正是 OpenAI 现在真正想要和需要的(尽管他们还不知道)。

      问题在于,你所讨论的是一项政治任务。我的意思不是说这是 “左派与右派 ”的政治斗争,我的意思是,让这项工作变得困难的首要任务是,让许多人就集成开发环境如何运作的一些低级细节达成一致。LLM 可以生成文本,但他们没有政治组织的意愿。要完成一项任务,他们不可能走出去,试图将许多人的需求以妥协的方式统一起来,这就需要下定决心,找出这些人真正想要和需要的东西,而这正是完成这项特定任务的唯一途径。自然语言即应用程序编程接口(Natural-language-as-API)的想法不知为何让很多人认为,未来应用程序编程接口和正式的技术标准将不再需要,但我并没有看到这方面的证据。

      还有第二个问题,即一致性问题: 法律硕士鼓励你将编码工作拱手相让。我决不会把使用 VSCode 这样的平庸工具编写大量代码的痛苦拱手让人,因为我作为从事这项工作的情报人员所学到的东西,正是我需要知道的,以便能够制作出更有效地从事这项工作的工具。我利用我所学到的知识来设计协议、数据结构、库、框架和编程语言,它们不仅能**掩盖软件开发的根本痛苦,还能大大减少痛苦。

      1. > 为什么 OpenAI 不能用振动编码自己的 Windsurf/Cursor 竞争对手?

        答案显而易见,那就是振动编码不起作用。

        如果可行,OpenAI 就不需要购买 Windsurf 了。

        1. 我和你一样对振动编码持怀疑态度。我认为工程是一门艺术,所以不适合我。

          尽管如此,我听说过的振动编码方面的问题都是可以解决的,或者说大部分都是可以解决的。我甚至可以说,这些问题的表现形式与集成开发环境的问题如出一辙,正是因为这些问题,人类才会如此笨拙地使用集成开发环境,这也是为什么我们要把使用集成开发环境的烦恼强加给人工智能的原因。

          这个领域最大的问题,也是唯一的问题是,我们使用的工具没有语言来描述重构背后的逻辑–意图。如果你从未捕捉到用户的意图,你就无法从中学习。从最高级别的用户体验到最低级别的序列化:补丁格式,都缺乏捕捉用户意图的能力。

          这就是为什么我认为他们真正需要的是我的技术,而不是 Windsurf 的技术 — 我正在努力从上到下捕捉用户意图。

          1. > 我听到的那些问题

            这就是这些东西的问题所在。都是道听途说。

          2. 提交信息是开发人员分享开发意图的多种方式之一,难道提交信息中没有描述开发意图吗?代码只是 “是什么 ”和 “如何做”。为什么应该在 Wiki、Readmes、Commit、Issue tracker 中……

            1. 比方说,修改是为了重命名一个变量。补丁格式永远无法捕捉到重命名变量的意图。当然,您可以在提交信息中这样说,但操作永远不会被记录下来,只有它的效果,导致涉及重命名的合并产生冲突

              1. 这是因为代码是执行机器的数据。所有其他的东西都是为人类大脑准备的。有多种方法可以将代码从一种状态转换到另一种状态,因此大多数人都会记录转换的存在(版本控制)和发生转换的原因(提交和其他文本)。

                记录 “如何 ”并无益处,除非技术很好。在这种情况下,精华会被提取出来,成为检查表或脚本。

                如果有两个 itents 产生了相互矛盾的补丁,那么出现的合并意图就是好的,因为它能带来共鸣(理解信息)和和谐(代码工作)。这就是为什么几乎每个人都说代码本身并不重要。只有它所带来的功能和孕育它的思想才是最重要的。代码只是一种媒介。

                合并冲突很好,因为它能检测到重叠的工作,而且相关人员最好能碰面。

            2. 通常情况下,意图需要很好地定义,例如公关讨论、用例/需求评估或积压工作中的用户故事。

          3. 我不知道,克莱恩现在正在为我编写一些东西,而我正在浏览黑客新闻。

            1. 是啊,这对我来说很奇怪,但我已经接受了。我这样做是为了做我想用的软件,我认为这是每个人都应该拥有的机会。

      2. 我点击的下一个链接完美地捕捉到了这一点: https://blog.ollien.com/posts/llm-friction/

        引用奥利恩的话

        > 即使作为一个 “大语言模型(LLM)怀疑论者”,我也不能说这些工具对软件开发毫无用处。很明显,在某些情况下,这些工具是有用的,无论是执行对于 IDE 工具来说过于复杂的重构,还是进行概念验证。尽管如此,在我使用 LLM 和观察他人使用 LLM 的过程中,我发现了一个令人担忧的趋势:LLM 有助于减少软件开发过程中的摩擦,而这些摩擦可以帮助我们更好地理解和改进我们所开发的系统。

        有趣的是,在我谈论的案例中,“对于 IDE 工具来说过于复杂的重构 ”恰恰是需要被感受到的那种摩擦

        1. 如果重构超出了集成开发环境工具的范围,那么工程师/开发人员就更有责任知道自己在做什么,而不是把它外包给大语言模型(LLM)背后的 “大脑”。

        2. 我不会用大语言模型(LLM)进行严肃的重构。实际上,现在 LLM 对我最有用的是使用流行库的普通 “食谱”。

        3. 这种摩擦是重构时需要追寻的气味。

      3. 我一直在从头开始构建文本编辑器。最近,我将整个代码库上传到 Gemini,以讨论不同的任务。我完全同意大语言模型(LLM)根本无法决定如何做事!如果你对提示稍作调整,它就会提出一个完全不同的架构。你必须非常小心地从模型中的货物崇拜最佳实践中提取出正确的东西。还有一点,一个非常明显的优化可能就在眼前,但它不会提出建议,除非你说:“你考虑过 XYZ 吗?”然后它突然就会不停地谈论 XYZ!但最重要的是,你必须有强大的意志力,引导它朝着你想要的方向前进。

    2. OpenAI 为什么要编写代码?他们拥有数百名经验丰富的软件工程师。Vibe 编码的目的是取代实习生,而不是你的实际团队。

      他们不想涉足特定行业(软件开发人工智能、业务流程管理人工智能、知识工作者人工智能)。他们只做人工智能部分。也许现在这种情况正在改变,但他们仍然让其他人来承担风险–你知道,那些对编码充满热情的人。当产品得到验证后,他们可能会收购它。

      1. 为什么要用人工智能取代实习生?我们的目标是给别人提供经验,让他们以后再来找工作。如果用人工智能取代实习生,就不要抱怨以后找不到开发人员了。

        1. 没错:现在没有实习生和大三学生,以后就不会有大四和大五学生。

      2. 我的真实看法?Vibe 编码能让高级工程师的工作效率提高 2-4 倍,具体取决于项目。大型项目的回报率会递减,生产率收益为 0% 或负数。我只需稍微考虑一下如何安排任务和代码,就能同时监督 10 个振动编码会话。这就好比给每个顶级工程师配备自己的员工。

        人工智能程序员与人类程序员在能做和不能做的事情上是不同的,他们都非常笨–同时*精通技术。

        1. 疯狂索取。2-4 倍的生产力,直到你不得不重构或修复任何东西,才意识到你刚刚创建了一个 10,000 行的蒸汽堆。

          1. 最近,我花了两周时间来修复一个项目,我在度假时,一位高级工程师似乎还在编写代码。在此之前,他们的工作质量和进度都非常出色。

            这两周对我来说简直是地狱。我估计我不得不重写大约 90% 的代码。所有的东西都是拼凑起来的,最终都是一次性的。不幸的是,这项工作本来是几个里程碑中的第一个,作为项目的基础完全无法挽救。

            我并不反对使用人工智能工具,我自己也在使用。但作为接受方,却不得不处理别人的代码垃圾,这真的很可怕。

          2. 我不同意这种负面看法。我可以使用 Claude 快速探索我不熟悉的库,并开发了一套开发流程,即在标记符文件中描述每个类和方法的用途,并让 Claude、Gemini、deep seek 和 Chat 在共享的标记符文件中说明如何实现这些类和方法。我可以自己编写这些代码,但我发现这样工作起来更快。

            1. 所以,你已经成功地确保了一件事,那就是你永远不需要想出任何点子。你把自己变成了机器人

            2. 当克劳德对你撒谎时,你会怎么做?你的工作流程太疯狂了。快写代码吧

    3. Vibe 用什么编码?4.1? 他们的编码模型和代理编码器产品都是个笑话。他们必须使用克劳德

      1. 关于应该使用哪种大语言模型(LLM)才能获得好结果,似乎还没有达成稳定的共识。这在某种程度上是很自然的,因为事情发展得很快–而且评估方法还不成熟(我们仅有的评估方法也被人玩弄于股掌之间)。

        但从表面上看,很多争论似乎都是 “没有真正的苏格兰人工智能”。或 “你只是拿错了”(参考苹果公司)。

      2. 在我为数不多的振动编码冒险中,我发现 4.1 比 Claude 更优越。

    4. 现金很便宜。对于 OpenAI 和据称 100 万用户来说,30 亿美元并不算多。

    5. 我想这就是 Anthropic 和谷歌利用 Claude Code 和 Firebase Studio 所做的事情。

      最主要的是营销和用户群,这一点不容小觑。

    6. 他们根本不在乎技术。这完全是为了企业账户和用户数据。Windsurf 赶上了企业采用代理编码集成开发环境的第一波浪潮,他们现在拥有大量大客户。

      1. 没有异议,我认为开发者增强技术是 LLMs 的惊人产品化,而且很可能会更好地将企业转化为付费客户。

        但是,OpenAI 拥有最好的品牌知名度和最大的用户群,而且他们拥有推动这一切的核心技术。鉴于这些 VSCode 衍生产品/插件 GPT 封装产品如雨后春笋般涌现,“数以吨计 ”的客户数量是多少?

        如果这是一个建设与购买的决定,30 亿美元?他们光是运行服务器就在疯狂地烧钱,而 300 亿美元募集资金的其余部分也很不稳定,而且可能不会有后续资金,在这种情况下,这值得银行存款的三分之一吗?我对他们的财务决策持怀疑态度。

        1. OpenAI 拥有巨大的 B2C 品牌价值,但他们的企业产品却很少。消费者聊天机器人的人工智能时代即将结束,谁能抓住 B2B 的心智,实现真正的应用,谁就是赢家。

          这也与争取时间有关。他们能在六个月内推出有竞争力的产品吗?也许可以,但即便如此,当他们准备就绪时,也已经落后市场好几年了。

      2. 有趣的是,OpenAI 和 Anthropic 仍然拒绝与任何有 “企业”(信息安全、AAA、审计日志)需求的人交谈,即使他们愿意支付低于 150 个席位的费用。

        1. 微软、甲骨文、Goole 等公司很乐意处理企业席位。

    7. 即使只有 10 个人,也需要时间来设计、构建并销售给同等规模的用户群。而且,如果你只是想复制这一切,也不能保证得到同样的结果。如果价格合适,为什么不走捷径呢?

      1. 30 亿美元的价格合适吗?这可能是 Windsurf 的估值(引出 “以目前公平的市场价格卖给愿意的买家 ”的说法),但这就好比说 “OpenAI 从零开始招募员工、建立竞争对手并获得相当数量的付费用户,需要花费 30 多亿美元”……考虑到其中的含义,这感觉就像一个疯狂的声明?

        尤其是考虑到 Windsurf(我认为 Cursor 也是)是 VSCode 的一个分叉,而 OpenAI 与微软的关系又足够亲密?这甚至不是零到一的构建。

        1. 如果他们是在优化成本(显然不是),那么当然会减少构建时间。如果他们是在优化时间,而前面提到的 “振动代码 ”步骤甚至可能不是最耗时的部分,那么是的,这个价格可能是合适的。

    8. > 为什么 OpenAI 不能为自己的 Windsurf/Cursor 竞争对手编写 vibe 代码?(严肃的问题)。

      因为 IDE 必须经过测试才能正常工作和运行。而不是 “Vibe 编码”。

      Vibe 编码不是软件工程。

      构建比购买更好。

    9. 他们可以。不过考虑到他们正在煎的鱼有多少,他们可能需要人才。

    10. 他们只是太专注于解决更重要的问题,主要是围绕模型改进和达到 AGI。

    11. 任何人都可以编写自己的 Windsurf/Cursor 替代程序,并根据自己的需要进行相应调整。你并不需要大多数功能,其中大多数功能的开发都是出于 “大型企业客户需要某项功能 ”的考虑。无论如何,真正的价值来自于底层模型。

      这看起来更像是一个短期的战术举措,目的是提高他们的 “API 使用率 ”KPI,因为与 Gemini/Claude 相比,它看起来并不好。(大部分流量是 chatgpt.com 的免费用户)

  2. 几点想法

    1)我同意这些公司的护城河很薄。从理论上讲,自动完成(而不是代理流)是 Cursor 吸引用户的主要功能。这可能比作者认为的更难;确定提供模型的上下文是一个不明显的问题–如何权衡延迟和模型质量?尽管如此,它已经被实施了很多次,所以主要还是要看底层模型有多好。

    2)说到模型,我不确定是否有独立的基准测试,但从表面上看,GPT 4.1 是自动完成功能的合理竞争者。几天前,Windsurf 的 Varun 甚至参加了 GPT 4.1 发布会的直播,所以很明显 Windsurf 确实打算使用它们。

    3) 这可能是股票交易,而不是现金交易。不知道作者为何如此确信风浪公司必须支付 30 亿美元现金。目前还没有任何地方报道过这一点。

    4)如果代理流量真的起飞,数据将成为更有意义的护城河。有了 Cursor 或 Windsurf 这样的平台,这些公司就能收集到用户如何编码的遥测数据,而这些数据仅从 repo 或成品中是无法收集到的。它为 RLHF 和其他方法提供了有趣的机会,以完善代理流。这可能就是它的魅力所在。

    1. 代理流很快就会超越自动完成。像 claude sonnet 3.5 这样的模型已经足够好了,尽管需要用户主动限制上下文的长度。

      最近,gemini 2.5 pro 使代理工作流程变得可用,以及如何使用!

      1. 你在 gemini 2.5 中使用的是什么代理工作流程?有没有使用双子座 2.5 的克劳德代码?

        1. 有很多集成开发环境扩展允许使用 Gemini 2.5 pro 和 flash 实现代理工作流

        2. 可以与 Aider 一起使用。虽然我绝对讨厌 Gemini 2.5 写 Rust 的方式。它的写法就像一个 C++ 开发人员昨天略读了 Rust 参考文献一样。不过对于其他语言来说,这也许是个不错的选择

        3. 我只用过 Cursor。

          我已经看到了曙光!

          1. 是的,就是这样!无论人们喜欢与否,专业环境中的 SWE 都将永远改变。

            任何理智的组织都不会接受任何不强制 SWE 使用这些工具的做法。细节可能会有不同,有些会因为 “知识产权 ”而延迟,但都会很快趋于一致。

            这并不是说,在自己的时间里以老式的方式进行工作就没有乐趣可言:)

    2. > 拥有一个像 Cursor 或 Windsurf 这样的平台,这些公司就能收集到用户如何编码的遥测数据,而这些数据是无法通过查看 repo 或成品来获得的。

      如果你为底层模型提供 API,难道你不清楚用户是如何编码的吗?

      因为所有这些都包含在向你的模型提供的上下文中。

      1. > 如果你为底层模型的应用程序接口提供动力,难道你不清楚用户是如何编码的吗?

        你有代码,但没有所有其他信号。一个简单的例子是 “接受信号”,在这个信号中,有人会得到一个自动完成的信息,并接受或拒绝它。如果使用 /architect 模式等,情况就会变得更加复杂,但你可能可以从集成开发环境中获得很多信号,而这些信号仅通过 API 响应是无法获得的。

    3. 我在脚注中提到,这很可能是股票交易!

      我没有想到 RL 的遥测技术,这非常有趣

    4. 关于 1),你有什么资料来源?据我所见,以及我自己和我认识的人的使用情况来看,人们使用光标的主要功能是代理功能,为你编写代码,只需点击 “接受 ”即可。光标选项卡是一个不错的功能,但在我看来,这并不是使用它的主要原因。

    5. 1)已经过时。光标一开始是自动完成的,但现在都是代理流了。

    6. 数据一直是最大的护城河。

      一些历史最悠久的公司都是数据公司,比如你的信用评级提供商、你的商业验证机构、你的美国运通。

    7. OpenAI 意识到基础模型是一种非常昂贵的商品。

      他们需要快速购买收入流

      XAI 拥有 Twitter(广告),Meta 拥有一切

      这就是为什么 OpenAI 将建立一个社交网络或搜索引擎,并尽快进入广告领域。

    8. 如果是股票交易,那就更糟糕了,因为 OpenAI 说他们的股票价值肯定低于 30 亿美元。

  3. >有些公司在自动完成方面做得更好(Copilot),有些公司在代理流程方面做得更好(Claude Code)。有些旨在成为最适合非技术人员使用的软件(Bolt 或 Replit),有些则适合大型企业使用(同样是 Copilot)。尽管如此,所有这些 “差异化 ”最终也只能带来 1-2% 的产品差异。事实上,这些工具的用户体验和核心功能在本质上是完全相同的,这一点我怎么强调都不为过。

    这仅仅指用户体验还是全部功能?

    因为我可以直接告诉你,cursor(Claude)和 copilot 的差别不是 1%。在我的公司,尽管 copilot 是免费的,但大多数人还是要自己花钱购买 cursor 许可证。

    1. 同意,虽然我们公司严禁在工作中使用 cursor,但他们一直在讨论企业许可证的问题。

      但我在个人工作中使用 cursor,即使最近增加了 copilot 代理模式,效果也是天壤之别。我告诉我的首席技术官,他问我们是否应该研究一下 cursor,我直截了当地告诉他,相比之下,copilot 基本上毫无用处。

        1. 我没有使用 Cursor(我用的是 Jetbrains),但据我了解,肯定是自动完成功能。Github Copilot 根本无法使用。上个月我试过很多次,它建议的所有内容都是愚蠢和完全错误的。这些建议并不是微妙的错误,它们往往与我正在做的事情毫无关系。一开始还没这么糟。要知道,我主要用 Python 编程,大多数时候都是很普通的东西。

          我一直在这里读到 Cursor 有很好的自动完成功能,因此与 Copilot 相比,我们可能要讨论的是 1000% 的改进,而不是其他评论者所说的 1% 的改进。

          1. 有意思。我使用的是 Jetbrains+Copilot 系统,我发现自动完成功能在 90% 的情况下都很有用。

            我使用的是 Claude 后端,而不是默认的(OpenAI)。不知道这是否会造成差异。

          2. 就我个人而言,我见过 Cursor 以与 Copilot 大致相同的速度提出愚蠢的自动完成建议。而且光标还存在其他令人讨厌的错误,它的 “跳转 ”建议(试图预测光标的下一个移动位置)通常都很愚蠢。所以我最终还是换回了 Copilot。

            1. 我不会把我收到的建议说成是愚蠢的,而是灾难性的。我默认关闭了填写功能,因为它们太愚蠢了,让人难以忍受。但也许每个月我都会有几次精力不济,面临着典型的重复性任务:用可预测的值填写这个大词典,键入这些类是另一个类的变体,写一些非常繁琐的测试,诸如此类。我打开它,希望它能帮我省点事,看看它有什么建议,然后在几秒钟内又把它关掉。它真的再也无法捕捉到明显可预测的本地模式了。我不知道它发生了什么事,因为它以前至少能做到这一点。

    2. 同意,我在工作和个人项目中都用过。Copilot 自动完成功能很棒,但并不具有突破性。光标为我构建了近乎全部的功能。

      我认为 Copilot 可以达到这个水平。我喜欢大多数微软开发工具和集成开发环境。但在我看来,它还远远没有达到那个水平。

    3. cursor(克劳德)与 copilot 的差距不是 1%。

      没错,但作为两者的用户和 Cursor 的拥护者,VS Code Copilot 正在迅速迎头赶上。

    4. 你还能说更多吗?

      我指的是用户体验,因为这是主要产品。Cursor 并不提供自己的模型,至少据我所知,大多数人都自带钥匙。

      我没有广泛使用过 copilot,但我的理解是,他们现在在 IDE 层面的功能已经相当,但底层模型却没有那么好。

      1. >您能说得更详细些吗?

        我的经验是,copilot 基本上是一个更好的自动完成工具,但任何超出三行的内容都会偏离当前上下文,导致答案毫无用处–不遵循代码库的惯例、使用不存在的包、看不到全局等等。

        与此相反,cursor 对周围的环境了如指掌,它能指出你选择的命名方式与其他地方的命名方式有冲突,你的测试失败是因为在一个完全不同的地方泄露了奇怪的配置,等等。

        我使用 cursor 时没有自带按键,所以它默认使用 claude-3.5-sonnet。我总是在作曲家模式下使用它。虽然我不能完全肯定地告诉你其性能更好的原因,但我强烈怀疑这与它如何在代码库中搜索上下文以提供给模型有关。

        现在的情况是,我经常在启动任务时,直接在 Jira 说明中添加一些额外信息,然后看着它工作。虽然它本身无法一次性完成任务,但它会以这样一种方式浮现出切入点、问题和小细节,因此从这里开始比从白板开始更有用,这已经是一个很大的优点了。

        它还可以用作橡皮鸭,同事可以向它询问设计是否优秀、重构潜力、瓶颈、童子军等问题。

      2. > 光标没有提供自己的模型

        对于需要最智能模型的用例,是的,他们没有。

        但是,在有些情况下,由于延迟的原因,你无法使用最好的模型。例如,下一次编辑预测,以及应用你决定使用的超级智能模型生成的差异 [0]。据我所知,Cursor 在这些方面使用的是他们自己的模型,这就是为什么即使你自带 Anthropic API 密钥,如果不支付 20 美元/月的费用,就无法使用 Cursor 的原因。在 Copilot 中应用 Claude 生成的内容实在是太慢了,慢到我都不想用了。

        如果你很早就试用过 Cursor,我建议你现在就更新之前的版本。光标大约在一年前进行了重新设计,与两年前发布的产品相比已经完全不同了。

        [0] 我们可能很快就不需要模型来应用差异了,正如 Aider 排行榜所示,最近的模型开始能够生成实际应用的完美差异。

        1. (我最近一次使用 cursor 是在 10 月份,当时我还没转用 Avante,所以我想我已经体验过你所说的那个版本的工具了。我大部分时间都没有使用自动完成功能,而是使用聊天问答侧边栏)。

          1. 我只为自动完成功能支付了 Cursor 的费用,我想这就是区别所在。

            我有时会使用 Composer(或最近版本中的 Agent),但它对我的作用越来越小。不知道为什么 🙁

          2. 重新设计是 5 个月前的事了。如果你是在 10 月份更换的,那么你 100% 没有使用过当前的光标体验。

  4. 这是一出人才与分配的戏。天赋:显而易见。

    发行: OpenAI 相信,他们出售的边际代币将增加他们的底线,因此目标是交付尽可能多的代币。Windsurf 已经拥有 1000 多个企业标识,据称下载量已达数百万。200 万枚代币 × 0.00001 美元的毛利/代币 = 20 美元/座位/月;如果 Windsrf 拥有 5 亿个座位,Oai 将获得 1.2 亿美元/年的毛利,利润率为 90%。

    我在英国的酒吧公司也看到了类似的情况。到 2000 年代中期,主要的参与者都倒闭了。由于成本上升和需求持续下降,利润率几乎为零,而且他们还背负了太多昂贵的长期债务。

    但对于啤酒制造商来说,它们是有利可图的销售渠道。于是喜力开始大肆收购。他们并不在乎从酒馆本身赚钱,而是乐于让酒馆经营收支平衡。这是因为他们有了一个可控的啤酒分销渠道(他们从每一品脱啤酒的运输中获利)。

    这里的转换成本与此大相径庭,而且市场仍处于起步阶段。这是一个单薄的产品,vscode-copilot 可以迎头赶上。但是,在当今最有前途的人工智能终端市场上,以企业价值的 1%(3,000 亿美元中的 30 亿美元)来赌拥有第二匹马并不算多。

    1. 我在文章中提到了分销,以及怀疑分销是主要驱动力的原因(尽管我同意可能是这样)

      关于人才,我不清楚 windsurf 的规模有多大,但这些团队一般不是都很小吗?一个小团队的 30 亿美元看起来还是挺高的,尤其是(我想)他们的核心专长更多是用户体验和产品,而不是毫尔研究。这并不是说用户体验和产品不值得收购,只是说如果这是最主要的理由,那么价格标签就令人吃惊了。

      1. 鉴于山姆最近说他认为消费者将是有价值的途径,也许为一个优秀的用户体验/产品团队付出的代价并不算太高

        “本-汤普森 五年后什么更有价值?是一个日活跃用户达 10 亿、无需进行客户获取的目的地网站,还是最先进的模式?

        萨姆-奥特曼:我认为是10亿用户网站。

    2. 净利润率是多少?有人靠推理赚钱了吗?

  5. 具有讽刺意味的是,30 亿美元证明了这些工具并不像预期的那样有效,在不久的将来也不会取代编码员。

    否则,如果可以让人工智能编码代理免费(几乎免费)完成,为什么还要花 30 亿呢?

      1. OpenAI 的用户和品牌知名度远高于 Windsurf。如果他们决定制作自己的代码编辑器并将其推向市场,我敢肯定它的用户群会很快超过 Windsurf。

  6. 这篇分析太差了。它声称,OpenAI 将其 400 亿募集资金中的 “30 亿 ”花在了 Windsurf 上。谁说这是一笔全现金交易?

    因此,如果你全部或部分购买股权,关键的问题是,你相信这个产品未来的价值会超过 30 亿美元吗?这一点都不夸张。

    Cursor 与 Anthropic 的关系也非常亲密,因此,如果我是 OpenAI,我不介意在这个领域插入一个竞争产品。顺便说一句,这个领域是在你的平台上展示真正价值创造的最前沿。

    1. (我在脚注中提到,这很可能是一笔股票交易!)。

  7. 这让我想起了 Snowflake 收购 Streamlit。这表明收购方钱包鼓鼓,内部执行缓慢,而非收购的引人注目。

    1. 8 亿美元收购 streamlit 仍是我听过的最令人震惊的收购故事。Codeium只花了几美元,听起来还算合理。

    2. 雪花市场过去/现在都是一团糟。我一直在想,是什么原因让他们选择了 streamlit。

  8. > Windsurf 正在为 OpenAI 提供数据访问权限?当然有这种可能–不过这也让我怀疑,如果OpenAI不再能够访问GitHub,那么他们与微软的关系会变得多么糟糕。

    这忽略了一个重要的细微差别。通过编写副驾驶员代码产生的有价值数据并不是代码,而是产生代码的人机交互步骤。

    Windsurf 和 Cursor 是有效的众包数据注释农场,为其所有者提供了提供更好编码模型的优势。我认为在这笔交易中,这比人才或软件更重要。

  9. Windsurf/Codeium 有一个企业版本,企业可以使用自己的硬件堆栈(非云)提供人工智能辅助编码环境。这有利于保护隐私和专有权,尤其是在数据不能外泄的情况下。运行 Codeium 所需的硬件要比让 700 名开发人员生成代币便宜得多。这种模式有机会产生许多付费客户。至于市值是否达到 400 亿美元,目前还不清楚。

    1. 我认为问题不在于 Windsurf 的实用性。这样的工具/服务显然是有好处的。

      文章提出的问题(就我所见)是价格和时机。30 亿美元是个大数目。对于一个已知价值但影响力有限的东西来说,这个价格是否过高?更何况还有财大气粗的竞争对手。另一个问题是–为什么是现在?现在收购 Windsuf 对 OpenAI 有什么好处?

      1. 它是 Copilot 的竞争对手,Zillow、戴尔和 Anduril(新成立的国防公司)都在使用它。Cursor 目前无法在 airgapped 环境中工作。我不知道 Codeium 运行预授权版本的费用是多少,但他们拥有 1000 多家企业客户。Codeium 在如此短的时间内从 12.5 亿美元迅速增长到 28.5 亿美元。

        Codeium 可以进行微调。虽然它是在类似的开放源代码上进行训练的,但它可以保证不会无意中在错误的授权软件代码上进行训练。

        https://windsurf.com/blog/copilot-trains-on-gpl-codeium-does

    2. 谢谢,我感觉可能是这样,因为他们似乎在企业领域投入了更多。也就是说,他们在这方面比 copilot 做得更好吗?msft 在这一市场的经验和执行能力肯定更强?

      1. Codeium 的完成模式比 GitHub Copilot 的任何模式都要好。对我来说,Cursor > Codeium >> Copilot。是的,Copilot 就是这么糟糕。

        没错,Codeium/Windsurf 更关注企业客户。正如 GP 所说,他们有内部部署[0]、混合 SaaS 产品和企业功能(如集合信用额度)。他们的支持团队反应更快(与 Anysphere 相比)。Windsurf 也 “感觉 ”比 Cursor 更完善。

        [0]但最终,如果你想 “振动编码”,你必须调用克劳德 API。

        1. 好的,谢谢,这是我的后续问题 — 我以为气隙实现会差很多,因为它们不能返回到 Claude 或 Gemini

      2. 它是 Copilot 的竞争对手,Zillow、戴尔和 Anduril(新成立的国防公司)都在使用它。Cursor 目前无法在 airgapped 环境中工作。我不知道 Codeium 运行预授权版本的费用是多少,但他们拥有 1000 多家企业客户。Codeium 在如此短的时间内从 12.5 亿美元迅速增长到 28.5 亿美元。

        Codeium 可以进行微调。虽然它是在类似的开放源代码上进行训练的,但它可以保证不会无意中在错误的授权软件代码上进行训练。

        https://windsurf.com/blog/copilot-trains-on-gpl-codeium-does

  10. OpenAI 可能有 3 个主要原因

    1. 在他们陷入模型军备竞赛的同时,将他们的团队转移到光标/firebase studio/ windsurf 克隆上的机会成本,如果冒着失去优势的风险,可能比 30 亿美元更有价值。

    2. 在交易完成的第一天,他们就能获得一百万用户,并立即拥有团队和排名第二的最佳集成开发环境,这让他们在谷歌和 Anthropic 等其他模型竞争对手面前如虎添翼。就个人而言,我仍然认为我们还处于建设的早期阶段,建设更有意义,所以理由 1 仍然最有说服力。

    3. 你可以得到专门的帆板团队,他们可以百分之百地专注于这个产品,而你的主要模型团队则可以继续工作

    1. 在我看来,人们低估了聘请具有专业领域知识的人员所付出的努力。也许他们可以尝试从这些团队中买一个人,然后让他帮助建立核心 IDE 团队,但这将比购买一个非常强大的团队花费更长的时间。

  11. 目前使用 Claude code 和 Cursor,但 VSCode 正在迅速复制 Cursor。不知道 VSCode 的分叉能否存活。理想情况下,我们会让 VSCode 拥有强大的代理能力和完全开放的 “自带大语言模型(LLM) ”功能。

    1. 从未使用过游标,但这似乎很容易实现。代码已经有了完全可以做到这一点的扩展。

      1. 在本月刚刚发布的代理模式之前,Cursor 比 Copilot 好得多。更不用说在 Copilot 之前,它已经拥有 MCP 相当长的一段时间了。

  12. 对我来说,这相当简单明了。

    OpenAI 主要是一家消费级人工智能公司。Anthropic 从 Claude 3.5 开始也赢得了开发者的青睐。从比例上来说,开发者也是企业环境中人工智能的最大使用者。OpenAI 并不想成为 “ChatGPT 公司”。而且现在花钱要比以后花钱划算得多。

    但无论如何,这都只是猜测而已。

  13. 不可能是为了软件,因为他们声称人工智能也能做到这一点,所以 30 亿美元从头开始写应该绰绰有余。

  14. 这是一个可以打入企业、广泛用户群、训练数据、获得竞争者市场覆盖面的载体(我相信风帆领域的初级大语言模型(LLM)一定是克劳德,就像它在光标领域一样)。

    除此之外,这些集成开发环境还有可能成为 “人人都能使用的振动编码”,并有可能代表下一代通用办公工具。还不如从一个专门的产品团队开始,而不是组建一个新的团队。

  15. 预测:

    OpenAI将收购Windsurf,然后将其免费提供给一个更便宜的OpenAI计划,有效地试图杀死其他集成开发环境,并获得数据,这有助于它与Claude和Gemini竞争/更好地竞争。

    谷歌需要推出自己的同类产品,而 Anthropic 则需要制定自己的计划。

    1. 谷歌已经这样做了:https://firebase.studio/

      1. 不是苹果对苹果,Firebase studio 不是与 Firebace 绑定,而不是通用开发吗?

        说实话,我没有深入研究,因为我是根据名称做出上述假设的。

        1. 不,它只是 Project IDX 的重命名版本,是他们基于云的 VS Code fork。无需使用 Firebase,这只是品牌效应。

  16. 通常的原因不就是在那里工作的人吗?

  17. 我猜是遥测数据。

    OAI在Mercor上花了很多钱,而Windsurf遥测也得到了类似的数据。我的猜测是,如果他们不采取任何遏制措施,他们的Mercor花费在未来5年将达到每年近10亿美元。

  18. 编码助手可能是近期的主要利润来源。它现在很有用,客户(即雇主)也愿意为生产力买单。

    企业在人工智能上的支出超过消费者,这只是开始。到了不再用美元换便士的时候,每个人都会想加入企业。

    文章正确地指出,OAI 现在对代码来说并不划算。我想他们会针对现在的用例进行优化。

  19. > 对苹果来说,最坏的情况是他们决定延迟使用用户数据。

    鉴于苹果多年来对 E2E 的倚重,我认为除了本地设备上的东西之外,这种情况根本不会发生。

  20. 30 亿美元这个数字在很大程度上是一种营销手段,以显示 OpenAI 是一家多么大、多么真实、多么重要的公司。我希望 Windsurf 也能从这笔交易中获得一些真金白银。如果 ChatGPT 明天就消失了,人们只会转向下一个模式。

  21. 文章认为:”不过,如果 OpenAI 不再能访问 GitHub,我不禁要问,他们与微软的关系到底有多差?他们的关系是否正在恶化?

  22. 文章中没有说明–也不一定能解释价格标签–但风帆如果只是比光标或克劳德代码更好。否则,人们不会转而使用它。

  23. “目前还不清楚 OpenAI 是否真的有 400 亿美元可花”。

    我们能确认这是一笔现金交易吗?

  24. 我真的很喜欢风帆,但不幸的是,现在需要寻找另一种选择。

    很遗憾,我们不能有好东西不被消耗掉,但–这就是世界。

    1. 我也一样。我怀疑他们是否会保留让我选择使用哪种模式的选项。不能相信 OpenAI。

  25. 利用你的代码库,让你成为依赖者

  26. >OpenAI 还宣布了一个社交媒体项目

    在发这篇文章之前,我还没听说过这个项目,但如果他们要在 2025 年启动一个 “社交媒体但有人工智能 ”的网站,不禁让人觉得他们已经准备好了。

  27. 因为光标太贪婪了。

    在与 Windsurf 接触之前,OpenAI 先是想收购 Cursor(这也是我预测的想法[0]),然后谈判两次失败![1]

    事实上,他们不止一次地与光标接触,这说明他们真的想收购光标。但光标想要的更多,而且正在筹集超过 100 亿美元的资金。

    相反,OpenAI 去了 Windsurf。Windsurf 的团队应该慎重考虑,由于竞争激烈、估值过高和当前的人工智能炒作周期,他们应该出售。

    风帆和光标的收入都可能很快蒸发。不要像光标公司那样贪婪。

    [0] https://news.ycombinator.com/item?id=43708867

    [1] https://techcrunch.com/2025/04/17/openai-pursued-cursor-make

  28. 如果你仔细观察 Windsurf 的通讯,我想很明显,这笔交易不会发生。

      1. 官方代表一再表示这纯属猜测。

        1. 即使交易是真的,他们也得这么说。他们可能根本没被告知。

        2. 谷歌体育场团队在被关闭前几分钟还在说他们不会关闭。

        3. >纯属猜测

          或者叫似是而非的否认。他们总是否认这些报道。

          归根结底,Windsurf 有一个私人价格标签,他们知道自己会以这个价格出售。

          如果他们聪明的话,就应该考虑卖掉这些炒作。

  29. 从道德/伦理的角度出发,我已经不再使用 chatGPT。对于简单的研究问题来说,所有竞争对手实际上都是一样的,所以我还不如用一个不可能是卑鄙小人的供应商。

    1. 你搬到哪一家了?

      遗憾的是,我还没有找到像 CGPT 一样好的聊天/搜索/基因接口。

      即使是 Ada 机器上的自托管 deepseek 也达不到我的要求,因为开源界面仍然很糟糕。

      1. 主要是双子座 – 但我用它来帮助完成房屋项目、美化环境、购物等,而不是用来编码。我不是一个卑鄙的主人,但感觉比 OpenAI 好。

        1. 鉴于谷歌在隐私方面的记录,这是一个奇怪的选择。双子座默认使用你的聊天记录进行训练和人工审核。你可以选择关闭 App Activity,但这样就会禁用聊天记录和集成,使其变得有点无用。克劳德默认尊重你的隐私,而 ChatGPT 和 Grok 的退出选项也不会让应用完全瘫痪。

          那么是什么让谷歌不那么卑鄙呢?更便宜的价格?我相信这不会持续太久–他们以前在YouTube、谷歌阅读器和搜索上都玩过这种游戏:勾引用户,占据主导地位,然后 “精益求精”。谷歌的老套路:好→垄断→垃圾。

    2. 哪个供应商不是人渣或被人渣拥有?

      1. 我一直在使用 Grok(免费),所以理论上我是在让供应商在我身上花钱。

        1. Grok 是与社交网络相关的两大品牌模型之一?他们连被考虑的资格都没有。

        2. 但他们可以把你算作用户,这对他们的估值有积极影响。

          1. 考虑到 Grok 计算的每个用户都在积极消耗他们的现金,这也是该领域众多倒置激励机制之一。

        3. >>哪个供应商不是跑路的人渣或被人渣所拥有?>>我一直在使用 Grok

          最大的人渣,但 “我免费使用”。

  30. 我认为,人工智能领域的商业模式是站得住脚的。风帆类就是一个例子。还有更多。

    人工智能将带来比一次提示或一次聊天更大的工作成果。人类升级更大的工作流程,与人工智能的互动将是其中一个重要的关键类别。

  31. 他们应该用自己的人工智能构建理想世界。笑死人了,他们就是扯淡的生成器。

  32. > 我一直是资本主义和自由市场的坚定捍卫者,尽管这在我的特定社交圈中历来不受欢迎。看着大语言模型(LLM)市场,我不禁感到非常庆幸。在过去的 5 年里,尽管模型质量直线上升,但每个代币的成本却在无情地降低。科技巨头之间残酷而惨烈的竞争只为普通消费者留下了财富。

    在解释了谷歌是如何主导市场以及他们是如何因涉嫌非法垄断行为而卷入反垄断诉讼之后,我们才说这些话,这真是一种莫大的讽刺。

    当然,这也故意忽略了人工智能市场目前所处的资本主义阶段。我们都知道故事的结局。随着时间的推移,人工智能公司将不可避免地合并,产品也将最终实现智能化。随着像 OpenAI 这样的公司寻求退出,它们将上市或被收购,并需要大幅削减脂肪,以实现长期盈利。

    我们将开始看到人工智能产品加入广告、提高价格,以及我们在其他所有新技术领域都见过的其他负面最终状态。例如,当我从 Uber 上搭车时,他们会在我等车时向我展示广告。他们在亏钱的时候可不会这么做。

    当然,“自由市场 ”资本主义也不是真正意义上的自由市场,在这样的环境中,对一些国家随意征收或取消关税。

    我真的不明白为什么人们觉得需要这样来捍卫资本主义。资本主义不需要捍卫者,如果有的话,它一直需要人们来约束它。

    1. 当我读到有关苹果公司的部分时,我也有类似的想法。一个惩罚尊重用户隐私的玩家,同时奖励那些拿走一切未钉牢东西的人的系统,并不是一个好系统。

      作者把苹果的选择归结为自己的目标,但我更愿意把它看作是资本主义失败的展示。

  33. 我预测今年夏天我们将迎来振动编码的高峰期。工具不可能永远亏本出售,成本会因各种原因上升,我认为随着速度/错误配额开始倒退,工具产生的技术债务最终会得到管理层的认可。我不认为自动驾驶开发者会及时出现,另一个人工智能寒冬将随着即将到来的经济衰退而到来。

    1. 好吧,我要发表一个略有争议的声明: Vibe编码既有A)潜在的巨大重要性和变革性,也有B)巨大的好处。

      大多数对 vibe 编码的批评都来自那些从事大型复杂代码库工作的 SWE,他们的产品被很多人使用,安全性、边缘情况、可维护性等都是极为重要的考虑因素。在这种情况下,振动编码显然是一个可怕的想法,而且我们离人工智能能做的事情还很远,只能在边缘稍作辅助。

      但是,由一个人使用、输出结果易于验证的小型定制脚本实际上是非常重要的。每天可能有数百万件事情要做,如果做这件事的人拥有编写一个小脚本的技能,就能大大加快速度。但大多数人并不具备这样的技能,而且雇佣一个真正的程序员来解决这些问题实在是太贵了,摩擦也太多了。人工智能可以做这些事情。

      每个具体实例都不是什么大问题,也不会对生产率产生多大影响,但总体而言,潜在的收益是巨大的,而且人工智能已经足以完全创建这类脚本。只是,人们还需要一段时间来转变视角,开始询问自己每天都在做哪些可以编写脚本的小任务。

      这就是 “虚拟编码 ”的真正潜力所在。一个不会编程,但知道自己需要什么(以及如何验证它是否有效)的人,会做出一些供自己使用的东西。

      1. 我在企业 IT 部门工作,同时也是一家小企业的首席技术官。在我看来,人们到处执行小脚本简直就是噩梦。尤其是在本地,但即使是在更安全的环境下在线运行,只要会对其他系统产生副作用,风险就非常大。如果不会产生副作用,那么这个程序很可能一文不值。

        另外,我已经在低代码中看到过这种情况。他们的说辞如出一辙,几乎是一字不差: “公民开发者将能独自解决企业边缘的诸多问题”。但这并不奏效。大多数用户学不会这些技术,但更重要的是:他们甚至不知道如何用语言表达自己的需求。相信我的话,大多数人并不想设计解决方案,而在那些愿意设计的人中,只有一小部分人能够做到。

        1. > 我已经看到这个故事在低代码中上演。推销方式是一样的

          这就是重点。与低代码或无代码的鬼话不同,这在某种程度上奏效了。人们 “神奇地 ”想要设计解决方案,而且现在能够做到了。

          > 人们到处执行小脚本,这在我看来简直就是噩梦。

          我也是。不过,看着人们多么渴望(他们确实可以!)通过这些大语言模型(LLM) 生成的恐怖程序取得进展,我相信是时候放弃了,开始设计安全的系统,尽管存在大量略有破绽的脚本。

          1. > 人们 “神奇地 ”想要设计解决方案,而且现在已经能够做到了。

            我同意,与低代码/无代码相比,LLM 大大降低了门槛,但大多数人都无法设计解决方案,因为他们缺乏业务分析技能,也不够注重细节,无法跟进需求说明。更不用说在需求不断变化的情况下对工作项目进行维护的纪律了。

            即使我们同意 LLM 将大量工作转移到业务分析/产品所有权/解决方案设计上,我在从小到大的公司中从事企业 IT 工作的经验也表明,用户并不会神奇地变成 BA、PO 或 PM。这些角色的职业化和专业化是有原因的。

            我不介意被证明是错的,这并不是说我个人受到了威胁或什么的。我觉得受到威胁的是我所监管的系统的完整性。

            > 我认为是时候放弃并开始设计安全的系统了。

            好吧,我不会为此承担责任,我的工作已经够多了。我不会允许一个任意的销售代表通过自动化手段与我们的 Salesforce 生产实例进行交互,就这样。即使他们在 Salesforce 中配置了适当的权限级别,我也能想到无数种方法让他们把自己的数据弄得一团糟。与本地机器交互:也可能是一个超级大的漏洞黑洞。其中有些漏洞可能比数据丢失更严重,例如将数据虹吸给恶意行为者。

            如果有人能想到让公民开发人员通过脚本与关键企业系统交互的安全方法,那很好。我就坐在这里等着!

        2. 嗯,我觉得这可能行得通,但我们(SWE 专业人员)需要提供一个二级私有 API 表面,假定用户是敌对的。也就是说,如果你想自动执行与任何私有软件交互的操作,就必须把它当作对手来对待。

          我想,从长远来看,这可能是值得的,但要实现这一点,还需要很长的路要走。

      2. > 这就是 “虚拟编码 ”的真正潜力。不会编程,但知道自己需要什么的人

        我认为,真正赚钱的领域和目前的差距在于 vibe tasking,而不是 vibe coding。

        对于数百万知识工作者来说,综合和处理办公工件(excel 表、salesforce 对象、电子邮件、tableau 报告等)的能力至关重要。也有很多员工认为这些任务中的很多都是 “狗屁工作”,还有很多雇主希望将这些任务自动化。像 Appian 这样的公司试图让 CEO 们相信,数字流程自动化可以解决这个问题,但困难的现实是,这些任务也需要一些灵活的思维(”如果加里的 TPS 数据没有及时显示出来,我的报告该怎么写?) 与那些需要快速、肮脏的应用程序或脚本的人相比,这是一个更大、更有利可图的市场。

        多年来,人们也曾多次尝试解决这一问题。在 “键盘自动化”(宏录制、AutoHotKey 类型的东西)和 “公民编程”(VB 类型的工具、power automate)以及 “面向应用的大语言模型”(excel 的 copilot 等)之间的某个地方,存在着一个杀手级产品和一个等待逃离的巨大市场。

        有趣的是,根据我自己的经验,IT 领域的大公司(msft、salesforce 等)似乎都决心将体验孤立起来,这样对话式语言模型(LLM) 界面就只能在他们的世界里运行。这也许就是虚拟任务尚未成功的原因。也许 MCP 或 MCP 市场会迫使某种程度的开放,但现在下结论还为时尚早。

      3. 强加一。这或多或少也是我所在公司正在努力的方向–越来越多表面上不懂技术的人能够与经验丰富的工程师一起为代码库做出贡献。

        1. > 表面上不懂技术的人也能为经验丰富的工程师的代码库做出贡献。

          那么谁是贡献者?是人工智能还是提示编写者?

          我的意思是,如果他们只是贡献自己的提示,我会更放心。那么,这究竟有什么价值呢?这里有很多复杂的感受。

          在工作中,我有一个 React 开发人员正在将 Java 代码合并到一个相当复杂的项目中。很明显,这些代码大量使用了提示符,看起来就像初级 Java 开发人员编写的代码一样。不同的是,初级 Java 开发人员可能已经为这些代码付出了几天的汗水,因此她对这些代码了如指掌,并且能够对其进行维护。而 React 开发人员只会编写更多的提示,或者让人工智能来做。

          如果我们确信提示可以创建良好的代码和可靠的项目,那么我们就不再需要昂贵的开发人员了,不是吗?

      4. 我非常支持任何能让软件工程变得更容易的东西。我原则上不反对 vibe 编码。我对 vibe 编码的问题在于它的实用性:它会产生更多低质量的代码,而不是让人们实现比以前更多的功能。

        迄今为止,我看到的几乎所有通过 vibe 编码实现的目标,都早已可以在低代码/无代码平台上实现。vibe 编码所带来的自由有很大的价值(因此,我支持它),但这种批评所缺少的一点是,vibe 编码并不是编写这些简单脚本的唯一方法,而且是最不可靠的方法。

        Vibe 编码是未来的趋势,但这只是一种毫无新意的未来愿景。未来是更少的代码,而不是更多的代码。

        1. 在看过一位销售人员和一位项目经理的振动编码后,我想说的是,现有的开发人员并不是振动编码的初始对象。Vibe 编码绝对可以让非开发人员实现比以前更多的功能。

          1. 问题在于教育,而不是可能性。Vibe coding 被大肆炒作,已经渗透到了非技术人员的圈子,让非技术人员有信心尝试制作东西。同样的人也可以使用 Zapier 或 Airtable 或 Tally 或 Retool 或 Bubble 或 n8n 来实现他们的目标,但他们没有这样做的信心,也不了解这些工具。

        2. > 迄今为止,我看到的几乎所有使用 vibe 编码实现的目标,都早已可以通过低代码/无代码平台实现。

          我曾试着向别人展示 Bubble,作为一个相当简单的工作流程(一个表单输入、几个大语言模型(LLM)调用、一个输出)的解决方案,他们本应能在几分钟内完成。

          这是一次可怕的经历,因为 Bubble 无法在 “无代码”(简单)和 “足够强大 ”的自定义功能之间找到正确的平衡。最终的结果是,根据我的经验,非技术人员如果不投入大量时间,就无法在 Bubble 中实现工作流。

          相比之下,使用 vanilla Claude.ai 或 Lovable 只需**次提示即可完成。只有一个

          我认为你严重低估了真正的非技术用户的差异。甚至是那些需要完成一些非关键任务的无聊/不堪重负的技术用户,如果他们需要花几个小时去弄一个没有代码的图形用户界面,那他们就永远无法完成任务了。

      5. 这是我有争议的说法:

        Vibe 编码就像客户雇佣程序员一样。

        如果所有代码都由人工智能编写,那就根本不是编码,而是订购。

      6. 我不认为那是一个 30 亿美元的市场。

        1. 我不喜欢这个词,但最终 “虚拟编码 ”应该会取代许多现有的无代码/低代码平台,对吗?在我看来,对于许多用例而言,这几乎是板上钉钉的事。

          > 低代码和无代码开发平台允许专业开发人员和普通开发人员在可视化软件开发环境中快速高效地创建应用程序。事实上,开发可用于解决业务问题的应用程序几乎不需要编码经验,这凸显了该技术对全球组织的价值。毫不奇怪,预计到 2027 年,全球低代码平台市场规模将达到约 650 亿美元。[0]

          我们可以争论确切的无代码 TAM,但如果你有机会成为无代码替代技术的市场领导者,30 亿美元似乎是公平的,不是吗?

          [0] https://www.statista.com/topics/8461/low-code-and-no-code-pl

          1. 我不同意,恰恰相反。低代码/无代码之所以有价值,是因为你将责任推给了由专家开发和维护的系统。对企业来说,每天在 Zapier 上运行一次的任务要比由营销团队中只会编码的人创建的任务好得多。低代码/无代码平台的前景非常光明,因为它们可以利用 LLM 帮助人们轻松创建可靠的任务。

            启用了大语言模型(LLM) 的 Zapier 或 Make 或 n8n 才是未来,而不是每个人都在一个接一个地编写克劳德编写的 NextJS 应用程序。

            1. 是的,我完全同意你的观点。我几乎写了一篇更长、更细致的评论。首先,低代码和无代码实际上是两码事。

              低代码有很多用例。我接触过的两种主要情况是 MVP,其中会用到 Bubble 等工具;另一种情况是创建企业内部工具,其中 MS Power Platform 很常见。

              企业 IT 部门对定制的 Web 应用程序过敏,而 Power Platform 项目由于其易于理解的安全含义,更容易获得批准。低代码用例肯定是 Windsurf 这样的工具最后要征服的。

              不过,即使没有这个用例,在人工智能密集的投资环境中,30 亿美元在我看来也不算太差。不过,我在并购方面毫无经验。

        2. 实际上,我认为这些小脚本如果得到广泛应用,其规模远不止于此。即使仅在美国,更不用说全球了。我还比较肯定的是,如果他们不把钱投入到研究等方面,订阅推理服务很可能已经有利可图。这些公司之所以烧钱,是因为他们在研究上投入了资金,而不是因为每月 10 美元的费用不足以支付平均推理成本。虽然我很想找到一个比我所看到的相关推测更好的来源。

      7. 可塑软件。这一切都让我想起了 80 年代的个人计算,当时每台机器上都有 BASIC,还有 Emacs 这样为此而生的环境。

        我认为 LLM 在这类软件方面的机会要比 Emacs 或 BASIC 大得多,但我也怀疑它是否有前途:一旦人工智能有了足够的能力,你就可以完全隐藏程序层,告诉计算机该做什么。

      8. > 但是,只供一个人使用、输出结果易于验证的小型定制脚本实际上是非常重要的。

        但它们容易被验证吗?

        我有一群人在非开发部门 “潜心编码”。这让他们能够做一些原本做不到的事情,这很了不起,但我认为说这很容易验证并不准确,除非我们谈论的是最琐碎的任务(“数一数这段文字中的字数”)。

        一旦任务变得稍微复杂(但远未到 “复杂 ”的程度),对他们来说,除了 “输出结果看起来有点像我预期的那样 ”之外,就再也无法验证了。也许对某些事情还是有用的,但如果你通过 “直观上看起来是正确的 ”来验证你的销售分析的准确性,那么你还想给它加多少分量呢?

    2. 我看过很多关于人工智能的炒作,但 “人工智能会让管理层认识到技术债务的重要性 ”这句话最有说服力。也许在 2040 年

      1. 管理层意识到并公开表示他们犯了一个错误?也许在 3025 年。

      2. 我希望你能找到好的管理者。我经常优先考虑偿还技术债务,而不是功能开发,因为这样做有商业意义。

        就像即使是冷冰冰的资本主义分析,开发人员的开发速度、新功能开发的便捷性、事件响应、稳定性、客户信任度等方面都有好处。

        但并不总是这样;当然也有一些技术债务困扰着我个人,但我知道不值得花投资回报率去清理。如果我想在生活中获得乐趣,这些项目就会变成周末项目,但如果有一点摩擦,也不会发生什么可怕的事情。

        1. 怎么做?我发现我的团队很难把减少技术债务作为 OKR,因为其他功能工作 1)对工程师来说更有吸引力 2)更容易产生具体价值。每个人原则上都同意技术债务是不好的。

          1. 问得好。这取决于你为什么要删除它。

            有时是因为经常出现错误,随叫随到会拖慢速度。

            有时,修改代码很困难,而且只有一个人知道发生了什么,因此要么存在总线因素风险,要么限制了分配项目/代码审查的灵活性。

            有时,系统的性能正在或将在中短期内引发事故。

            有时,事故恢复需要很长时间。我们有一个管道需要运行六到十个小时,如果中途出现故障,就无法重新启动。宕机后的恢复工作非常疯狂!

            有时,有许多功能的开发时间会被大大缩短,比烧掉技术债务来解锁这些功能所需的时间还要长。

            有时,重构可以提高系统性能,从而对客户产生有意义的影响或降低基础设施成本。

            然后

            有时,你的经理和工程师会以事业为重,他们不想或不能做出艰难的长期权衡,有时就是这样,你应该考虑更换团队或公司。

            所以,我想我要问你:为什么要烧掉它?

      3. 对于云软件来说,他们仍然需要弄清楚这一点

    3. 自 2008 年以来就没有出现过人工智能寒冬,现在肯定也不会有。尽管大家从那时起每隔几个月就会说一次。

      还有什么技术债务?如果你有优秀的工程师,他们的编码速度会更快。而且还能更快地解决 Bug。

      上周,我就用 2.5 在我们的 Rust 代码库中一次性完成了所有功能。代码绝对完美,有些地方比我写的还要好。

      然后在那一周的晚些时候,o3 和我一样解决了一个两个不同的 MLE 都没能解决的 Bug。

      我不知道为什么人们会认为这东西不好,这让我非常困惑。

      1. 如果机器修复的错误以后出现在原始上下文之外,我就无法识别了。

        如果我每天都学不到东西,这个职业对我来说就没什么意义。

    4. 在我看来:我们将利用免费的本地/廉价托管的开源模型和集成开发环境来编写代码。但是,如果微软能把 Office 卖给公司几十年,那么开放源代码也一定能把编码工具卖给公司几十年。

      1. 除非架构发生巨大变化,否则让一个 GPU 集群为众多用户运行推理总是要比让每个用户都拥有能够运行 SOTA 模型的硬件,但只在他们要求模型做某事的 1% 时间内使用要划算得多。

      2. 人们用于 “振动编码 ”的模型大小与大多数人能够轻松运行的模型大小之间存在着多个数量级的差距。缩小这一差距需要很多年的时间。

      3. > 但如果微软能把 Office 卖给公司几十年,那么开放人工智能肯定也能把编码工具卖给公司几十年。

        这似乎是一个大胆的声明。

    5. 我不知道,我已经使用 Gemini 2.5 有一段时间了。每天的配额上限实际上是 55 美元/天。虽然开发费用不高,但对于克劳德 3.7 还无法解决的项目来说,与人工相比,这绝对是值得的。

      我们将拭目以待双子座 2.5 Flash 是否足够出色,但它绝对不像是谷歌在培训后亏本出售的产品。

      是的,培训是一笔巨大的投资,但他们真的不打算做吗?似乎并非可有可无

    6. 在我看来,围绕振动编码的喋喋不休很像上世纪 90 年代末和 2000 年代初围绕外包的 FUD。在南亚花同样的价钱就能请到 10 个美国工程师,谁还会花大价钱请他们?媒体预测,IT 离岸外包将成为不可逆转的大趋势。显然,一些软件开发的确转移到了成本更低的地区。但美国的技术部门也出现了爆炸性增长。

      对于某些项目(如面向内部的 CRUD 应用程序),廉价代码是可以接受的。对于大规模消费产品而言,优质工程资源的成本只是利润的四舍五入误差,即使是微小的边际改进也能产生很高的绝对价值。

      我确信,振动编码将吞噬软件开发的最低端。同时,它还能创造出以前在经济上不可行的软件。但如果没有接近 AGI 的东西,我不认为它能明显地影响高端软件的开发。

      1. 亚洲程序员的进步速度赶不上法学硕士。

    7. 我同意基本前提–目前的法学硕士在编码方面还不够好,无法完全自主地达到实际可靠产品的最低质量水平。

      我不明白几个月后的编码高峰是如何形成的。请查看 Lovable(总收入超过 1000 万美元)或 Bolt.new(总收入超过 3000 万美元)等产品的收入和增长数据。这并不显示成本(事实上,他们可能深陷亏损),但有了这样的故事,我不认为它会在 3-4 个月内崩溃。

      在用户体验/期望方面,我可以看到 “构建完整应用程序 ”的过度宣传达到了顶峰,但这仍将使这些工具在 “快速原型设计和实验 ”方面处于强势地位。在我看来,仅这一点就足以防止断崖式下跌。

      即使考虑到专门用于编码的工具使用率达到顶峰,我也不认为这会导致 “人工智能寒冬”,因为 LLM 现在被广泛应用于各种情况,而且使用率还在强劲增长(与整个 “人工智能编码 ”市场无关)。

      最后,“成本会因各种原因而上升 ”的说法是可疑的,因为即使在模型变得更好的同时,每个令牌的成本也在下降(举个简单的例子,GPT-4.1 的成本大约是 GPT-4o 的 50%,同时也是一种改进)。

      基于这些原因,如果我能与你的预测对赌,我会立即下注。

    8. >,另一个人工智能的冬天将随着即将到来的

      哦,拜托。即使明天风险投资的每一分钱都花光了,我们仍然有很多年的时间来探索如何使用 LLM 和 “生成模型 ”来做很酷、很有用的事情。我说的 “我们 ”是指每个人,每个层面的人。众所周知,在他妈妈的地下室里的大胡子、年轻的大学毕业生、博士研究员、大型技术研究员,以及中间的每一个人。大势已去,这项技术将继续存在。

      各种人工智能寒冬的出现有很多原因,但没有一个是今天才出现的。如今的技术很酷!它还能立即派上用场(oAI、anthropic、goog 已经售出了价值数十亿美元的代币!)。它还具有高度变革性。过去两年中的创新数量令人难以置信。而且,“家庭用户 ”也首次可以使用它。羊驼之于骆驼,就如同家用电脑之于计算机。它表明,任何人都可以使用任何开放模型,并以低廉的价格训练它们完成下游任务。你猜怎么着,每个人都在这么做。从好色的青少年到商业分析师,他们今天都在使用这种方法。

      此外,与上一次不同的是,这一次的技术得到了顶级科技公司的支持和资助。在这一点上,风险投资公司并非孤军奋战。在 MS、goog、AMZ、Meta 甚至 AAPL 之间,他们都在为此投入数十亿美元。他们都想把钱赚回来,所以不管你喜不喜欢,这件事都会持续下去。(见鬼,连 IBM 都在做 gen ai=)))。

      所以,人工智能的冬天不会到来。

    9. > ……速度/错误配额开始反转……

      能详细说明一下吗?管理层(至少在你的公司)是这样看待代码的–以代码完成的速度与通过测试的次数之比来衡量吗?

    10. AirBnb 刚刚在 6 周内完成了为期 1.5 年的工程迁移,这要归功于人工智能。

      “Vibe “编码将继续存在,只有那些不知道如何适应的开发人员才会一厢情愿地寄希望于其他方式。

      1. 等等,我们甚至都不擅长估算,但现在我们知道 Vibe 编码节省了多少时间了吗?我迫不及待地想知道这些信息的来源。

          1. 不,他们不擅长。从小型初创公司到最成功的科技公司,我已经在这方面工作了几十年,但没有一家公司擅长估算。

            如果你阅读博文,他们能在一周内手动迁移 3% 的测试。以此推算,1.5 年的估计时间还不到一半。

            我还认为,自动化流程无法处理的那 3% 的测试很有可能比平均水平更复杂,而且开发人员在第一周之后就能更快地完成这些迁移。

            目前还不清楚实际比较的是什么。一个团队在 2023 年做了一次 POC,然后在 2024 年做了一些工作,然后花了 6 周时间调整管道,最后一周手动迁移了自动化流程无法处理的测试。

            但他们没有说明有多少人参与了这项工作,也没有说明有多少人将参与最初的项目。团队中可能只有一个人。

            至于实际工作是什么,那就是从一个测试框架迁移到另一个测试框架。如果一个团队不能在类似的时间内编写一个编译器来完成类似的工作,我会感到很惊讶。

      2. 无论 “活力编码 ”一词的含义是什么,它肯定不适用于专业软件组织进行的大规模迁移。

        1. Vibe 编码是指人工智能辅助编程。就是这样。

          1. 它是指让它生成代码,然后不看代码,纯粹靠感觉。如果你让它生成一些代码,然后深入挖掘代码并对其进行编辑,以至于你能解释每个变量名和每个变量名的理由,就好像你的老板会说你作弊并使用了大语言模型(LLM),如果你不能解释 “你的 ”代码,他就会解雇你一样,那就会拖慢你的速度,你就不再纯粹依靠 ~/vibes/~ 来编程了。

      3. “Airbnb最近完成了我们第一次大规模、大语言模型(LLM)驱动的代码迁移,将近3.5K个React组件测试文件从Enzyme更新为使用React测试库(RTL)代替。我们最初估计这需要花费 1.5 年的工程时间来手工完成,但通过结合使用前沿模型和强大的自动化,我们仅用 6 周就完成了整个迁移过程。

        我不以为然–它转换了一些测试文件。它没有设计任何架构、创建任何数据库、处理任何安全问题或任何其他程序员每天都要做/担心的事情。它基本上做的是源代码到源代码的翻译,这已经有 30 多年的历史了。

        1. 如果你在五年前告诉我,这样的转换可以在六周内完成,我肯定不会相信。即使存在一定程度的源对源。而且我肯定会认为,这样的转换会导致目标语言的代码变得丑陋、不流畅。

          1. > 我肯定会认为,这种转换会导致目标语言中出现可怕的、不符合语言习惯的代码。

            我们不知道最终代码的质量如何,但迁移造成的技术债务有可能远远高于 1.5 eng/y。

            1. 您试过吗?

              我用大语言模型(LLM)做过类似的工作。它产生的代码往往过于习以为常,因为它引入的传统方法对于手头的任务来说是矫枉过正。但这几乎是一种理想的情况,因为如果之前的测试运行得很干净,那么新转换的测试只能通过错误来失败。

              它们也会悄悄地减少测试场景,但这正是代码审查的目的。

              1. 我每天都用大语言模型(LLM)来编码。LLM 完全可以做出超级愚蠢的事情:哦,这个测试坏了,gatcha,让我们用一个没有坏(但非常不同)的东西替换它。

                > 他们还可以默默地减少测试场景,但这就是代码审查的作用。

                对复杂场景进行代码审查与实际编写代码一样需要大量资源,因此将花费的时间从 1.5 年缩短到 6 周可能会降低质量。

            2. 你真的认为 Airbnb 的软件工程师会接受低质量的最终代码吗?

              说真的,这种一厢情愿的想法实在是令人尴尬。

              1. 公司里有很多技术人员,他们推送一些夸夸其谈的东西,在简历上加个名字,然后去做下一个工作。不知道你为什么认为 Airbnb 与众不同。

        2. 通过不断推陈出新,你很容易就能告诉自己你没有输。

          1. 很好的回击–“老兄–相信我”:-P 除了你的观点,还有什么更有说服力的吗?你做过源代码到源代码的翻译工作吗(我做过……),还是这只是因为你以前从未见过而让你如此兴奋?

            1. 我可没说什么 “老兄,相信我 ”之类的话–也许你需要尝试一下 “学习如何阅读英语”。

              1. 没错,你没有提供任何证据,甚至没有像样的论据来支持你的立场。我提供了程序员每天都要面对的 3 个不同领域(很多领域)。我还指出,它所做的那些转换功能已经存在了几十年。

                但从你的评论历史来看,支持你的论点似乎并不是你的强项……

      4. 让我们等待第一波由于编码软件的缺陷而导致的安全漏洞吧。

        我很怀疑在训练数据中,无错误的代码是否会多于有错误的代码。

        1. 没人在乎。古代开发人员坚持认为,Vibe 编码将导致大量技术债务。

          1. 没人在乎。它仍然值得为提高生产力而疯狂。

          2. 没有证据表明这会导致长期问题,因为为什么会这样?

      5. 这并不是什么振动编码,而是他们把测试从一个框架翻译成了另一个框架。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注