初级开发人员的复仇

你好,你好,你好!很高兴再次见到大家

我最近说话真的得小心点了 有这么多人在看着我呢

总之,前几天我放了一个听起来像 “viiiibecooode ”的屁,马上就有三个投资人来找我。我不得不告诉他们,对不起,那只是个屁,只是为了让他们别烦我。

发生的事情太多了,我又一次尝试写这篇文章,但每一次尝试都变得巨大而狂暴,我不得不像老耶勒一样把它们都放下。这次我就趁它还是只小狗的时候把它运走吧。(编辑:该死,至少它的行动一直持续到最后。)

关于 “vibe coding “含义的简要说明: 在这篇文章中,我假定 vibe coding 将逐渐发展起来,人们将把它用于真正的工程设计,而 “关闭大脑 “版本的 vibe coding 则只用于原型设计和有趣的项目。对我来说,振动编码就是让人工智能来完成工作。你选择在多大程度上关注人工智能的工作,完全取决于手头的问题。对于生产,你要关注;对于原型,你要冷静。无论如何,如果你不是手写的,那就是有生命力的编码。

还有一点要注意:复仇的部分发生在最后,就像电影里一样。

好了!说完了这些行政事项,我们走吧!

第 1 部分:六波

Vibe 编码是对基于聊天的编码的一种异想天开的称呼,在这种编码中,你要求 LLM 写代码,然后把结果反馈给它,再要求它写更多的代码,不断循环。它与传统的编码,甚至是代码补全编码都截然不同。

聊天式编码在编码助手中已经存在了一段时间,但却没有一个统一的口号。今年二月初,因联合创立 OpenAI 而闻名的 Andrej Karpathy 博士为聊天编码起了一个好听的名字。他将其命名为 “氛围编码”,几乎一夜之间,它就成了蓝/金裙子的代名词。

今天,让我看看手表,就在你读这篇文章的时候,振动编码已经进入了一个奇怪的、前所未有的、量子般的三重状态:

  • 在硅谷之外,80% 的业内人士仍然完全看不到振动编码,他们几乎不知道我们在说什么。许多人甚至还没听说过 “振动编码 ”这个词,更不用说 “编码代理 ”了。我猜他们从来不看新闻吧?不幸的是,他们都有可能被人工智能 “忽悠”,不,是 “撞车”。
  • Vibe coding 目前正以惊人的指数曲线疯狂增长,登上了《纽约时报》等主要媒体,充斥着社交媒体,受到一些人的赞誉,也遭到另一些人的抨击。就在谷歌非官方地采用它的时候,一些公司正忙着取缔它。每个人都还在争论 “活力编码 ”到底是什么意思。但有很多人,每天都有更多的人,认为这是未来的趋势。
  • 对于以指数级速度增长的开发者群体来说,一般的聊天编码已经完全过时了,他们现在即使看到基于聊天的编码着火,也不会走到街对面去撒尿。他们仍在进行氛围编码,而且确实比任何人都能获得更好的氛围。然而,他们不可能不关心你的氛围编码–那些漫长的来来回回的聊天对话–再说一次,先生,您好,我说的是 “好”。日!

在Exaggeration中心,我们发现很难再编出比这更疯狂的事情了。它是真实的,但又发展得如此之快,让人真正感到超现实。

Vibe 编码正在迅速崛起,而基于聊天的编码–你们认为的 Vibe 编码,也就是我过去常说的 CHOP–确实也还在崛起……目前是这样。但是,代理编码–本篇文章的主题–很快就会被聊天编码赶超,就像它还在原地踏步一样。

到第三季度,今天的聊天编码对很多人来说将成为最后的退路,只能在无法使用代理的超级快速方式时使用。在聊天编码被淘汰的同时,Vibe 编码将继续存在。

在图 1 中,我尽力展现了我个人对这些问题的看法。

图 1:人工智能编码模式的重叠浪潮

图 1 中的图表描述了六个重叠的编程浪潮:传统编程(2022 年)、基于完成的编程(2023 年)、基于聊天的编程(2024 年)、编码代理(2025 年上半年)、代理集群(2025 年下半年)和代理舰队(2026 年)。

从图中可以看出,传统编码和基于完成度的编码这两种人工编码方式正在衰退,而其他编码方式则呈指数上升趋势。从聊天开始,每一个新的浪潮都比之前的浪潮上升得更快。最后,图中描绘的振动编码也呈指数增长,但与其他编码方式一起呈虚线增长,因为我们稍后会看到,振动编码并不是一种编码方式。

作为我们讨论的预告,”代理集群 “是我使用的一个占位术语,指开发人员能够并行运行并有效管理许多编码代理,甚至可能比开发人员本地机器上能容纳的还要多。而 “代理舰队 “则是指当我们为叶节点配备人工智能主管时的情况,如图 2″26 财年组织结构图 “所示。

图 2:26 财政年度组织结构图

这张图显示了组织中的所有个体贡献者(叶子节点)开发人员就像二级直线经理一样,管理着人工智能 “管理代理”,而 “管理代理 ”本身又监督着编码代理组。例如,在单个集成电路开发人员的指导下,一个管理代理组可能正在梳理积压的错误,另一个管理代理组可能正在开发新的业务功能,第三个管理代理组可能正在进行长期的架构迁移。这是一个名副其实的代理农场!

当然,这只是对未来发展的粗略估计,但我认为已经足够接近了。我们都预料到了 “第四波 ”编码代理的到来,而它们的到来比我们大多数人预料的都要快。而且,手动跳转到 “第五波 ”已经成为可能,尽管需要付出努力。我一直在并行运行两个代理。当你这样做的时候,就会发现很多工作都可以通过代理的帮助来完成。

代理如何帮助代理?如今,你必须注意到代理工作者何时卡住、旋转或完成,并适当地点拨它。主管代理可以而且很快就会开始为我们做大部分这样的工作。结果:第六波。开发人员将获得授权,在庞大的编码代理舰队中保持工作队列满员,在堆积如山的企业遗留代码中奋力前行。这将是光荣的。

最迟在 2026 年初,这些神奇的代理舰队就会出现。因为构建它们其实并不难–我们已经非常擅长并行化工作了。

这就是我们的闪电介绍。更多精彩,敬请期待。如果这一切让你大吃一惊,那么在未来的几个月里,你将面临一些麻烦。

第二部分:你在哪里?

如果您仍然认为基于人工智能的代码自动完成建议是程序员使用人工智能的主要方式,并且/或者您仍然在测量完成接受率 (CAR),那么您正坐在图 1 中代表传统编程的恐龙状曲线上。这条曲线将在 2027 年左右滑入淘汰期。

我有个坏消息: 代码补全在一年前还非常流行,现在感觉就像是遥远的前传。但现在,它们在人工智能领域就相当于 “行尸走肉”。

如果你比较前卫,那么你可能会认为聊天式编程是今年的发展趋势–也就是说,像 Copilot、Cursor、Sourcegraph 和 Windsurf 这样的内嵌IDE 编码助手聊天界面。如果你属于这一类,那么你的表现还不算太差。中等水平,拍拍手。你们至少采用了一种有用的方式–与代码完成相比非常有用–而且聊天的受欢迎程度还在上升。

但突然间,我们又迎来了新一轮的浪潮,新的编码代理,如 Aider.chat 和 Claude Code,而且很快就会在你最喜欢的集成开发环境中出现类似的、更漂亮的代理,眨眨眼,咳咳咳。

一旦你尝试过编码代理,并知道如何有效地使用它们,你就再也不想回头了。它们会让你的编码工作 “一塌糊涂”。最棒的是,使用代理时,您仍然可以进行编码。这就是为什么它不是一种模式: 你可以用任何非人工智能模式进行振动编码:聊天、代理、集群。只要人工智能在工作,你就在振动!与代理的唯一区别是,你不需要经常与他们会合。

现在,代理已经出现,我们可以开始看到模式。从聊天开始,每一个连续的模式浪潮的生产力都是前一个模式浪潮的 5 倍。聊天的效率是人工编码的 5 倍,代理的效率是聊天的 5 倍,以此类推。需要注意的是,如果不受挑战并有时间走向成熟,每一波的生产力都可能是前一波的 10 倍。但是,它们不断被新的、更快的模式所取代。

这就是我今天看到的情况。我们发现自己正处于人工智能海洋中的一场大竞赛中,被越来越猛烈的浪潮所包围。谁能成功,谁就能乘风破浪。每家公司都处于图 1 所示的一条或多条采用曲线上的某个位置。你在哪里?

亲爱的朋友们,这就是我对未来的迷人、迪斯尼化的心理模型。我曾断言,即将到来的集群和舰队浪潮不仅不可避免,而且就在眼前。摇摆编码仍然是这一格局中持久不变的特征,但与大多数人的想法不同。振动编码只是意味着再也不用写代码了。

如果你同意我的观点,那么让我们来看看经济影响。首先,我会让你快速了解代码代理的工作原理–它并不复杂,你只需开始烧钱,烟雾会让他们变得更聪明。如果你到现在还没明白我的意思,我鼓励你去玩玩这些新的编码代理。我是认真的。或者去看看懂行的人。

不管你是相信还是怀疑,至少让我们看看这些新的编码代理究竟是如何工作的。因为没有魔法。

第三部分:新骆驼主人手册

让我们来研究一下这些新的编码代理是如何工作的,以帮助您了解为什么这种仅有几周的发展会很快让您的公司陷入真正的困境。你可能会说,这是个大麻烦。一壶好鱼。

我们以前听说过软件编码代理的说法。但这次不同。这些 “真正的 ”编码代理仍然非常非常新,最多只有几周的历史,而且只能在基于文本的 1970 年代 Unix 风格终端中运行。要想得到这些代理,就好比你走了一辈子的路,有人给了你一头免费的骆驼。事实上,他们说,你想要多少骆驼都可以。拥有一头骆驼真是太棒了。一匹 比起到处走,骆驼很不错,但它们会向你吐口水,咬你,而且它们需要大量的绿叶食物,主要是五十块和几百块的。

我知道,你们中的很多人都对聊天编码持超级怀疑态度。我甚至听说,有些开发人员明确无误地向他们的经理表示,他们想继续写代码。他们说,这就是他们来这里的目的。写作。代码。他们说得很慢,好像他们认为你是聋子,这样会有帮助。他们声称自己永远不会把编码工作委托给人工智能。你好啊 我看见你了

所有持怀疑态度的人都应该放下手中的工作,把它扔在地上,然后疯了似的跑向最近的骆驼,跳上去。下载并试用一个编码代理,最好是在 2025 年 3 月 1 日之后推出的。因为它们会颠覆你对人工智能编码的所有认知或想象。就在三周前,我自己都几乎不敢相信我所看到的一切。

编码代理的原理非常简单。它们的工作方式就像典型的振动编码聊天会话,由 LLM 完成大部分分析和繁重的工作,而你则主要戴着耳机。不过,有了代理,你就不必再做双向复制/粘贴和相关提示这些难看的工作,因为这些都是慢人一步的部分。取而代之的是,代理会接手并为你处理这些工作,只有当它完成、卡住或你用完现金时,代理才会回来和你聊天。

他们往往能在完全无人协助的情况下走得很远。他们只需努力完成任务,直到成功为止,并根据需要向问题投掷代币以探索空间。在 90-99% 的工作中,人类不再是瓶颈,除此之外,这几乎就是更快版本的聊天式编码。

除了成本之外,与聊天的唯一实际区别是,代理可以同时执行大得多的子任务,可能包括许多单独的步骤。在这段时间里,主管开发人员可以腾出时间来做一些重要的工作,比如吃完那袋奇多和浏览 HN。而如果你试图在聊天会话中完成这些工作,你的键盘上就会粘满 Cheeto-slime,我是从一些相当可靠的消息来源得知的。

具体来说,你可以对编码代理说:”这是 JIRA 票 #<号>,请去修复它。你只需要说这些。代理首先会努力尝试访问 JIRA 票据:它可能会寻找 JIRA 命令行工具,甚至可能会问你能否下载它。它甚至可以为自己编写一个一次性程序,以编程方式获取票单字段。我们经常能看到他们写出这样的程序。

一旦代理可以读取票单,它就会使用你机器上的工具,像你一样检查你的代码,跟踪你的漏洞。它要求你为每个工具设置权限,这也是目前流程中最慢的一个环节。一旦代理发现了错误,它就会提出修复建议,编写测试来验证修复,运行这些测试,并做出任何其他必要的更改,以确保测试通过–在大多数情况下,所有这些都是循环进行的,不需要你的参与。

这些新的编码代理可以解决巨大的问题,也可以制造更大的混乱,总之,它们的行为就像一个速度超快的人类开发人员,但总是有点盲目,有点落后于计划。

这听起来像科幻小说,但你现在就可以使用它们。

重要的是要明白,这些新代理仍然只能同时处理中小型任务。任务图分解是我们在过去的聊天时代(12 月)都学过的技能,如今,当你转而使用代理进行振动编码时,它也同样重要。甚至更加重要,因为使用代理很容易超额完成任务,也很容易好高骛远。它们是如此不可思议地有效,以至于很容易变得贪婪和窒息。

虽然它们速度快、功能强大,但你仍然需要将事情细分,谨慎地管理编码代理。如果你给编码代理的任务太大,比如 “请修复我所有的 JIRA 单据”,它就会不顾一切地去解决问题,几乎一事无成。如今,它们需要谨慎的监督和深思熟虑的问题选择。简而言之,他们是一群暴躁的小动物。

但这一切都将改变。说到小动物,在你还没来得及鞭打蝙蝠之前,特工们就会悄悄进入你的 IDE,不是骆驼,而是鞍马:这当然主要是人体工程学方面的改进,但值得欢迎。当然,这主要是符合人体工程学的改进,但还是值得欢迎的。如果能有一种工具,能准确无误地向 36 米外的物体吐出恶臭的液体,那就再好不过了。

从现在起,工具的每一次迭代都将有助于让代理编码变得更简单、更可并行化、更强大。今年,我们将更频繁地看到真正的重大进步。

下一个是战车。让我们拭目以待。

第 4 部分:我被告知不会有数学

本部分针对首席信息官和财务人员。您好。感谢您阅读到这里。

在您几周前刚刚完成的 26 财年规划中,您为开发人员 LLM 支出预留了多少运营成本预算?少吗?很多?有一家公司告诉我,他们考虑为每位开发人员每天提供 25 美元的慷慨预算。这看起来很大胆,像是一大笔钱。几乎是不计后果的金额。

事实证明,他们的想法是对的。我们说的是非常非常昂贵。他们需要消耗大量的 LLM 代币,以目前的价格计算,每小时需要 10-12 美元。你的编码助理现在每个座位的许可费是多少?一个月 30 美元?大概?可能更少?

为了便于计算,根据经验法则,您可以认为每个编码代理实例的价值(在本财年内摊销)大约相当于增加一名初级软件开发人员–前提是有人(人类或人工智能)让它每天忙碌 8-10 个小时。

这是一个很好的经验法则。我想你会同意,对于一个只需要一个好保姆的专业软件工程师来说,每小时 10 美元简直是天价。

因此,你应该为每位开发人员每天的 LLM 费用预算 80-100 美元。每天 30 美元只够骑三个小时骆驼,午饭后开发人员又得继续走路。但如果你支付本-富兰克林的全额费用,每个开发人员的产出大约会翻一番,因为他们可以一边工作,一边为一个编码代理当保姆。这是毋庸置疑的。

但是

即将到来的浪潮,我称之为 “代理集群”,也就是我在上一节中提到的战车,应该会在第三季度登陆。这一浪潮将使每个开发人员都能同时并行运行多个代理,每个代理都在执行不同的任务:错误修复、问题改进、新功能、积压梳理、部署、文档等开发人员可能要做的任何事情。

每个开发人员都会突然变得像许多开发人员一样。至少,那些擅长此道的人会。(预示:我闻到了复仇的味道。)

Agent 集群的副作用是最终将软件开发推向云端。几十年来,人们一直在预测基于云的集成开发环境!对不对?你们中的一半人可能都曾尝试过构建一个。这似乎是个显而易见的想法。

但是,在本地运行集成开发环境总是更方便,因此基于云的开发从未兴起。2025 年下半年的代理集群浪潮将改变这一现状。你的开发桌面没有足够的能力同时运行几十个代理,更不用说几百个了。开发人员的大部分工作将在一夜之间转移到云端。

因此,您可能需要更多的云预算。

同时运行 N 个代理会将开发人员每天 10 美元的代理费用乘以 N,这还不算云成本,只是象征性的消耗。如果您的开发人员平均每人同时运行 5 个代理(这是一个非常保守的数字,因为代理大多是独立工作的,开发人员可以腾出时间做其他事情),那么这些开发人员现在每人每小时花费 50 美元,即每年大约花费 10 万美元。

这已经不是偷窃,而是抢劫了。我们说的是到 2025 年第四季度,每个开发人员的生产力将逐步提高约 5 倍(考虑到提升时间),而第一年的额外摊销成本可能只有 5 万美元/年。谁会不接受这笔交易呢?

不幸的是,你几乎可以肯定,在 2026 年的运营预算中,你并没有为每个开发人员编列每年 5 万美元的 LLM 费用。这种情况将迅速把公司分为有预算和无预算两类,有预算的公司将拥有预算。没有预算的公司几乎没有一半。听懂了吗?

说得更直白一点 软件开发现在是一列 “花钱就能玩 ”的子弹头列车。如果你买不起票,就有可能被甩在后面。

第五部分:代理舰队(agent fleet)即将到来

这里就开始让人有点不舒服了。如果你已经满头大汗或心有余悸,或许可以稍作休息,喝杯汽水,整理一下简历什么的。慢慢来。只要你准备好了 我们等着

好吧,从这里开始, 你都答应你是寒冷的, 球探的荣誉。我们开始吧

群集或特工 “舰队”(没有更好的词来形容)之后的浪潮,将允许你们的开发人员在更多特工的帮助下,一次运行 100 多个特工……。监管代理将能够管理由编码代理组成的群组或 pod,代表他们进行调解,只有在代理真正陷入困境时才会引入人类。

今后,软件开发人员的新工作很快将是管理编码代理及其人工智能主管的仪表板,如图 2 所示:26 财年组织结构图。有些人可能会嘲笑地称这项工作为 “保姆”,指责人工智能是爱抱怨的小机器人,需要大人把它们的食物切成小块,给它们换尿布,收拾它们的烂摊子,防止它们跑出游戏室。但我们更愿意称之为软件开发。这就是我们的命运。

对于你们这些首席信息官来说,车队可以让你们的开发人员每天花费数千美元。即使推理成本急剧下降,杰文斯悖论也会导致更高的使用率,从而抵消这些成本。如果你不相信,去看看你的错误积压吧,那基本上是无限的。

一天几千个?但这笔钱花得太值了!你的工程技术人员将开始能够以你希望的速度工作,就这一次。你能相信吗?就像重新回到初创公司一样。正如杰夫-贝索斯(Jeff Bezos)喜欢说的那样,你将能以你做梦都想不到的精英水平,“让客户惊喜和愉悦”。

但你必须在某个地方找到一大笔新预算。也许你很幸运,你的公司资金雄厚。例如,我刚刚听说,你们都知道的一个大品牌今年为 LLM 实验拨出了一大笔专项资金。我不知道有多少公司这样做了,而这样做也许在不知不觉中躲过了今年的预算规划黑天鹅事件?

如果你在沙发上找了一圈硬币之后,到了 EOY 仍然无法为每位开发人员凑齐额外的 5 万美元,也许你可以想办法筹到这笔钱。现在,这可能更适合初创公司,而不是大公司。我认为,代理这件事让很多竞争环境变得公平了。

这个故事的可怕之处在于,如果你找不到钱或筹不到钱,而你又想保持竞争力,那么你就必须进行痛苦的裁员,以腾出运营预算。如果你再计算一下,只有一个部门的削减是合理的。

剩下的,恐怕就只有读者自己去想了。我不知道会发生什么。我只是个普通人。也许这一切都被夸大了,你需要在我的预测上再加上六个月才能实现。我和克劳德争论了一会儿,克劳德妥协了,他说如果我把所有的预测都延长六个月,这也是有可能的。所以,坏消息也不全是坏消息!

现在是好消息!你先问的是坏消息吧?不管怎样,坏消息已经说出来了。从这里开始就很容易了,我们就快完成了。剩下的就是甜蜜的复仇了

第 6 部分:初级开发人员的复仇

事实证明,前面并不都是厄运和阴霾。远非如此!软件行业会有很多工作机会。只是不会是那种像野蛮人一样手写代码的工作。

自从我发表《初级开发人员之死》一文以来,我在过去一年里观察到的一个一致模式是,初级开发人员实际上比高级开发人员更热衷于采用人工智能。但事实并非总是如此;有一些人告诉我们,他们的后辈害怕使用人工智能,因为他们有些不理智地认为,人工智能会抢走他们的饭碗。(参见:行为后悔理论。感谢丹尼尔-洛克博士的指点!)

,但在大多数情况下,初级开发人员,包括(a)新入职的开发人员,(b)还在上学的开发人员,以及(c)还在考虑上学的开发人员,都能很快掌握这些知识。他们拿起 O’Reilly 的《人工智能工程》(AI Engineering)一书,现在所有开发人员都需要从头到尾了解这本书,他们把这本书当作工作培训。他们都在使用聊天编码,都在使用编码助手,我知道你们中的很多初级开发人员已经在使用编码代理了。

初级开发人员很活跃。他们明白了。世界在变,你必须适应。所以他们会适应!

而高级开发人员,嗯……说得温和点,是在挣扎。我身边不乏像我这样的老朋友,他们基本上从未接触过 LLM,甚至连裸体都没见过。还有很多人只是勉强接触过编码助理。我甚至还从许多行业领袖那里听说过一些资深开发人员,他们明确表示反对。

举个例子:一个知名品牌的技术总监刚刚告诉我,他们的一个开发人员给他们发了一份 PDF 文件,用彩色幻灯片和图表解释了为什么他们都需要放弃人工智能,回到常规的编码工作。现在你明白我说我们拥有科技史上最广泛的理解力分布是什么意思了吧?还有人认为这是加密技术之类的东西。哎呀

听着,毫无疑问,一些资深开发人员在挣扎,因为他们太忙了。我明白这一点。但我认为,对他们中的大多数人来说,还有更深层次的原因。当我在博客上谈论编程语言时,我发现仅仅是说我喜欢某种编程语言,任何一种语言,都会让我陷入令人吃惊的困境。人们会在主题中大喊大叫,数字唾沫星子到处飞溅。我不明白这是怎么回事。就因为我说我喜欢一种语言?

几年后我才明白,这是因为他们觉得如果大家都听我的,那么每个人都会转用这种语言,然后高级开发人员也必须学习这种语言。他们把必须学习新东西–我指的是真正的新东西,有点像从头开始–等同于失去工作和医疗保险,等同于破产,等同于死在医院外面的台阶上。面对巨大的不确定变化,这就是人类的天性。

我认为,令人遗憾的是,拒绝人工智能的人对现状投入了很多,他们错误地认为,现状等同于工作保障。他们都告诉自己,人工智能还没有证明它在执行 X、Y 或 Z 方面比他们做得好,因此,它还没有准备好。

但在我看来,是他们还没准备好。朋友们,我把这一切都说得很详细,这样你们就能帮助自己了。

不管那些傻瓜们为什么不采用它,他们已经输了。初级开发人员占据了制高点,战斗已经结束。不仅初级开发人员平均采用人工智能的速度更快,而且初级开发人员–令人惊讶的是!- 更便宜。如果公司要削减开发人员的工资,以代币取胜,你认为他们会留下哪些开发人员?

人工智能的顽固派还没有意识到这一点,所以初级开发人员必须放下手中的光剑,在山顶上大声喊出这一信息:

人工智能的工作不是证明自己比你们强。你的工作是利用人工智能变得更好。

否则,你会得到…… “其他 ”条款。你知道的 其他条款 熔岩 你会掉进去 我为什么要把这个拼出来?

我们到了电影的结尾 你们成功了 击掌,初级开发人员 去年我没预料到会发生这种事,但你们成功地把失败者淘汰出岛,给我留下了深刻印象。我也要向那些已经想通了这一点,并且已经开始行动的资深开发人员致敬。你们并没有想象中的那么多,至少在湾区泡沫之外是这样。

剩下的人……努力吧。像个少年。认真点 不管你是谁,也不管你是个人还是公司。靠过来。是时候了。人工智能来了

在 Sourcegraph,我们每天都在研究这个问题。我们正在努力创造一个世界,在这个世界里,所有这些东西尽管昂贵得令人难以置信,但却有着惊人的价值,而且很快就会变得无可争议。无论如何,对每个选择使用它的人来说都是如此。编码代理大军正在跨越卢比肯河,而让他们与企业知识产权资产和代码库连接起来,是城里的下一个大游戏。这正是我们关注的焦点。

更广泛地说,我们都认为会有工作机会。大量的工作机会。我们认为,现在的招聘平淡只是企业发出的信号,他们还不知道该做什么。但就在本财年,各种规模的公司都会比以往任何时候都更加雄心勃勃。从蒸汽到电力再到计算机,如果历史有任何指标的话,我们很快就会看到更多的人在创造软件。由此产生的生产力浪潮可能会以惊人的速度提升国家 GDP,100% 甚至更多。

但要参与其中,你就必须学习下一波浪潮。作为一名开发人员,甚至是一名项目经理或任何与技术相关的职位,你都需要学习并掌握编码代理技术。不要再磨磨蹭蹭了。现在就弄清楚如何使用自动编码代理,在掌握使用方法之前不要放弃。坚持下去,直到它为你所用。

不要自大,也不要太用力。当你一直使用动力铲时,编码代理就像一台大屁股的隧道掘进机。它很强大,当然,非常强大。但它价格昂贵,还是会严重卡住,你需要时刻小心引导它。而且它的速度也没那么快–它不可能在一天之内钻过英吉利海峡。因此,不要对它抱有不切实际的期望。只需关注这些东西与 2 年前 ChatGPT 出现时有多大不同,然后感叹它与 2 个月前有多大不同,当时我们拥有的最好的东西是聊天。

玩得开心点。这就是所谓 vibe coding 的原因。事实证明,不写代码其实很简单。

不要陷入诱人的工作延期陷阱。说 “6 个月后会更快,所以我把工作推后 6 个月”,就像说 “我要等到流量减少 ”一样。当然,你的车程会缩短。但你会最后到达。

特工来了 庞大的舰队 不仅仅是编码代理。代理无处不在,遍及整个企业和生产技术流程。今天上午,我与一位大客户进行了交谈,他已经建立了数十到数百个 “人工智能任务机器”–定制的代理,可以执行其巨大工作流程的特定部分。未来就是现在。座席员就在这里。

如果你正在寻找一个行动号召,那么我给人类和公司的建议都是一样的: 改用聊天。放弃填写。停止手工编写代码。了解验证和确认在新世界中是如何工作的。熟悉这个领域,了解最新技术。停止抱怨,将其转化为工程实践。继续努力。你能做到的。

最重要的是,密切关注新的编码代理。对于现在的大多数开发人员来说,它们可能几乎无法使用,但不会太久。不会太久。它们是无比昂贵的生产力机器,而且与人类相比,它们的价格还很低廉。所有人都将面临艰难的抉择。

到今年年底,“软件工程师 ”这个新职位将几乎不需要直接编码,而需要大量的代理保姆。你越早意识到这一点,你的生活就会越轻松。

如果你读到这里还不知道该怎么做,那就向初级开发人员求助吧。

差不多就是这样。我们即将迎来 “作弊就是你所需要的一切 ”两周年纪念日。从那时起,变化之大令人难以置信。如果我能把这篇博文发回到过去,两年前的自己肯定不会相信。

感谢我的老板奎恩-斯莱克(Quinn Slack)一周前提出的这些想法,让我们大开眼界。希望这篇文章对你有所帮助。我要去给一些投资者放个屁了。再见!

本文文字及图片出自 Revenge of the junior developer

你也许感兴趣的:

共有 79 条讨论

  1. 每个人:告诉我人工智能有多么伟大。

    没有人:用人工智能做出任何伟大的事情。

    Sourcegraph:一家人工智能公司,经常向 HN 推广他们的 LLM 乐观主义博文,使他们的商业模式所依赖的炒作循环永久化。

    1. 在我看来,这才是真正的试金石。如果 LLM 如此伟大,让每个人都如此高效,那么成果在哪里?那些本来需要 10 倍投资才能推出的令人惊叹的产品在哪里?难道不应该有任何我们可以指出的东西来表明 “生产力指针 “正在移动吗?

      1. 说实话,我不认为这能让每个人都变得如此高效!如果你真的知道自己在做什么,并且愿意燃烧代币,那么它真的会让你的工作更上一层楼–前提是你没有使用模型没有训练过的小众产品或语言。

        打个比方,这就好比音乐制作人的采样。采样就在那里–它已经是一个漂亮的采样,充满了弦乐和琴键,是一个光彩夺目的 8 小节循环。任何人都可以抓住它,但不是每个制作人都能把它卖出去或变成热门歌曲。

        归根结底,每一列炒作列车都有一定的道理。我强烈建议你试一试,如果你还没有的话。我很高兴我做到了–它真的帮了我很多,而且我(不幸的是,在经济上)已经迷上了它。

      2. 你在说什么?到处都在发生,所有公司都在发生。如何处理大量增加的代码输出已成为一个众所周知的问题。我觉得有趣的是,持反对意见的人声称这种情况不会发生,但同时又担心会产生大量低质量的代码。

      3. 演示就是工作。社交媒体的浏览量才是生产力的源泉。而风险投资公司则在为这个球继续滚动买单,希望有朝一日能最终大赚一笔。

        人工智能目前是一个非理性的市场,这种情况不会很快改变。

    2. 事实恰恰相反。大多数人并不吹嘘自己的生产力提高了,但这无处不在。除非你工作的公司不允许你使用这些工具,否则你不可能不知道。即使是我认识的最顽固的反对者,现在也在使用人工智能工具。新的讨论焦点在于代码输出的大量增加是否会导致问题(我认为会),但声称不会发生这种情况已经不再是一种严肃的态度了。

    3. 这棵树苗是一周前的两倍,而一周前的两倍又是一周前的两倍。照这样下去,不出一个月,它就会比整个世界还大了。

      1. 我想起了电影《追捕》中的一段对白:

         T:这香肠是怎么回事,查理?
            C:2 分钟,土耳其人。
            -- 5 分钟后 ---
         T:香肠还要多久?
            C:5 分钟,土耳其语。
            T:5 分钟前是 2 分钟。
        [/ 预]
        我不知道自己为什么会想起来。是人工智能,还是自动驾驶汽车,还是两者都有。呵呵。
          1. 无人机机器人今天送来了我的新洗碗机–顶部–轨道–栏杆;等了 4 天才等到人;SMH

        1. 自动驾驶汽车来了,只是分布不均。Waymo 已经在多个城市运营,为人们提供了数百万次搭乘服务。你没见过它们,不代表它们不存在。

          1. 从地图上看,Waymo 只在几个城市的极小部分运营。从这个角度看,他们并没有完成最初的 90%。
            Waymo 在封闭的线路上提供技术演示器,你可以付费在特定城市的特定区域乘坐他们的演示器。老实说,这还不算太差,但这些限制让他们离 “自动驾驶汽车已经到来 “还很远。即使是特斯拉,也还没有达到只使用摄像头子系统和 “如果撞车,两件都归你 “的政策。这只是另一种你可以买到的技术展示品。
            如果我们接受你的观点,即 “自动驾驶汽车已经到来”,那么我们就应该接受核聚变能源问题已经解决,因为美国西部托卡马克核电站的等离子体保持了 22 分钟;电力推进问题已经解决,因为我们的电动火车已经运行了很长时间;Hyperloop 已经完全投入使用,因为我的后院有一个模型,每天可以运送成千上万只蚂蚁。

            1. 人们打开手机,叫一辆车,从地理围栏区域内的任意点乘车前往该区域内的另一个任意点。在这个区域内,他们要处理现实生活中的各种情况:狗和孩子跑到街上、骑自行车的人、行驶中的卡车挡住了街道、建筑施工。其他车辆。也许这对你来说还不够,但这可不是精心制作的技术演示,汽车在迪士尼乐园的固定轨道上绕圈行驶,一旦偏离允许的范围就会坏掉。除非你认为 Waymo 付钱给洛杉矶的所有司机,让他们绕着自己的车开不同的路。
              如果托克马克在这 22 分钟里能量是正的,而且不止一个,每天运行多次,那么我会说它是正的。但事实并非如此。我不明白你为什么要把它们混为一谈。核聚变是一个完全不同的问题,它涉及尚未解决的材料科学问题和控制系统问题。我并不是说核聚变已经到来,而且我也不认为量子计算机会很快到来。

    4. >我们说的是,到 2025 年第四季度,每个开发人员的生产力将逐步提高约 5 倍(考虑到爬坡时间),而第一年的额外摊销成本可能只有 5 万美元/年。谁会不接受这笔交易呢?
      好吧,我也来赌一把。如果在 25 年第四季度,使用光标或其他工具的开发人员的工作效率是使用 emacs 的我的 5 倍,我就会再给人工智能一次机会。但我很确定这不会发生。

      1. 你也许应该比较一下同一个开发人员使用人工智能与不使用人工智能的情况。否则,你可以用这个论点来做任何事情。
        如果我们比较使用记事本的优秀开发人员和使用 emacs 的低劣开发人员,那么记事本就是比 emacs 更好的集成开发环境。

        1. 好吧,如果我发现其他开发人员的工作效率突然提高了 5 倍,我会试一试的,但到目前为止还没有证明有这种效果。这似乎是一个非常简单的研究问题,而且你会认为,如果有任何可证明的效果,销售这些东西的公司就会利用这些研究来推销他们的产品。那么,效果在哪里呢?

          1. 那里躺着一具尸体,但你不会相信他们真的死了,直到有人制作了一段凶手刺杀他们的视频重现,并把视频塞到你的脸上?
            说到视频,https://youtu.be/opi1s_5Dm-c 可能低于你的水平,而且有点长。

              1. 有人在利用这些新技术制造东西和赚钱,但因为他们没有停下来对自己的工作进行研究和撰写白皮书,你就想当然地认为它不存在。

                1. 是的,没有证据就没有效果。在 cursor.ai 的网站上,他们似乎没有任何地方声称使用他们的工具会让你或你的团队更有效率,这很能说明问题。

                  1. evidencthe absence of evidence doesn’t mean there’s no effect

                    1. 据我所知,没有任何可信的证据可以支持 “使用 LLM IDE 可以使开发人员的效率提高 5 倍 “这一说法。你不同意吗?褒贬不一,因为个人容易歇斯底里、产生错觉和胡编乱造。
                      我所要求的只是一些值得信赖的案例研究,毫不含糊地表明值得我花时间和金钱去关注这些 genai 的东西。这对一个价值上万亿美元的产业来说应该不难吧?比如说,让我看看这不只是歇斯底里的炒作。别告诉我,给我看看。

                    2. 效率提高 5 倍是什么意思?因为这就是问题所在。我们现在的问题是,如何衡量 “更有效”?我不是在说一个数字,5 倍 10 倍? .2 倍,因为你必须回去修改它写的低劣代码?我们没有衡量程序员工作效率的好方法。我们都知道代码行数是荒谬的。你又如何计算它占用了多少大脑空间。如果 LLM 让某个人整天在会议间隙敲出有用的代码,而他却需要一些真正安静的时间来做一些深入的工作,以适当地进入正确的状态……你如何衡量这一点,并在图表上显示每小时的代码行数和中断次数,从而得到一条向上向右的直线?
                      事实证明,这实际上是一个很难衡量的问题,因此,即使对于一个价值万亿美元的行业来说,这也是很难的。
                      你觉得这段视频怎么样?

    5. 哦,很好。当我看到这张图的时候,我就开始想,我到底被卖了什么。

  2. 我通常是抱怨炒作周期的人之一,对炒作周期持悲观态度通常是正确的。
    但在这种特殊情况下,我不得不认为很多人还没有尝试过它的最佳状态。不,不是 MacBook 上的本地模式。不,不是免费计划中的网络界面。花 300 美元购买 API 点数,花一个周末(或两个周末)时间完全设置好 aider,真正试一试。当你要弄清楚那些告诉你你的生计即将面临生存风险的人是否说到了点子上时,这最终只是一笔很小的钱,你觉得呢?

    1. 我发现自己的想法恰恰相反–我通常不会抱怨炒作周期,而是认为我们应该在保留判断之前静观其变。在这种情况下,我觉得我们已经看够了,知道法律硕士无法胜任任何人的工作。

    2. 300 美元?听起来能用一年。你不需要为了尝试而花费接近 300 美元的费用

      1. 我第一次使用克劳德代码(Claude Code)从头开始学习 Vibe 代码时,一次就花光了 50 美元的学分。每次与它互动时,你都要向它推送整整一档代币。

        1. 也许对我来说用不了这么多的原因是,我的作品大多是源文件,这些文件太大了,克劳德代码读取不了。它总是要请求允许才能使用 grep,因为它不知道如何正确使用读取工具。我已经用大约 15 美元的信用额度完成了整个新功能。

        2. 无论好坏,Claude 代码与 aider 相比,在同样的情况下,令牌的使用更少。

      2. 我们正在使用 Cline,如果你开始使用,很容易就能用掉 20-40 美元。价值主张是绝对存在的,所以我们承担了成本,但 OP 说得没错,代理编码吃代币就像没有明天一样。

      3. RTFA,代理通过信用点数搅动。这进一步证实了我的观点,即绝大多数人还没有真正尝试过。

        1. > RTFA,代理商通过信用额度进行搅动。
          我使用克劳德代码是我工作的一部分,所以要么是 “FA “错了,要么就是我的成本很低,因为我的工作正好有一个可以降低成本的代码库(笑)

      1. 我知道这不是你要问的,但答案是 300 美元。如果我在最初的评论中写的是 3000 美元,答案也是一样的。你不可能有足够的钱。

    3. >如果要搞清楚那些告诉你你的生计即将面临生存风险的人是否说到了点子上,这终究是一笔很小的数目,你觉得呢?
      没有。我宁愿买几本书或订阅 Jetbrains。

  3. >我有个坏消息: 代码补全在一年前非常流行,现在感觉就像遥远的前传。但现在它们在人工智能中的地位相当于 “行尸走肉”。
    我不同意。我认为这是一个 “机枪与 70 年代热沉导弹 “的二分法。当然,使用导弹更快。但是,有时你离导弹太近了。而且,机枪子弹比导弹便宜得多。然而,导弹刚问世时,被视为未来的趋势。有一段时间,战斗机是不带机枪的,但后来又加装了机枪,因为他们认为两者都需要。
    有时,我发现自己想要深入研究并编辑克劳德生成的内容。在这种情况下,copilot 还是非常不错的。
    关于人工智能辅助编码:你越了解自己在做什么,越了解代码库,就会得到越好的结果。在我看来,它就像一台旋耕机或其他电动工具。它犁地的速度比你快得多,而且是自动推进的,但它不是自动指挥的。使用它仍然需要计划,而且运行成本很高。在使用该工具时,你必须对其方向进行微观管理,不断从手上给它触觉反馈,否则它就会偏离方向。
    我想,旋耕机可以和雇工自己耕地相比,但雇工的微观管理比旋耕机要少得多。
    这有点像马和车。如果你喝醉了,马可以送你回家。汽车就不行。
    正确使用人工智能代理工具就像操作重型机械。初学者使用重型机械可能会伤害到自己,但高年级学生使用重型机械则会大有裨益。这个比喻更进一步:有时你需要离开挖掘机,用更小的工具挖掘,如手持锤或铲子。手锤就像副驾驶–一种中级电动工具,而克劳德代码就像挖掘机。笨拙、粗糙,但如果需要的话,可以快速完成大量工作。

    1. >笨拙、粗糙,但可以快速完成大量工作,如果需要的话。
      你知道什么在你的比喻中更快吗?咒语 或者在编码领域 模板、代码片段、代码生成器、框架和元编程。在这里,你可以将所有的模板抽象为几条命令。你已经知道你的暴力修改工具的爆炸半径,所以你不再需要对它们进行微观管理。而且它很可靠

  4. 我喜欢新技术变得像宗教一样。它既会培养出崇拜者,也会培养出批评者。
    从这个角度看,人工智能崇拜比加密崇拜更正确。至少我现在就可以用它来做一些实实在在的事情,而加密货币在多年后仍然毫无用处。
    从某种意义上说,我认为这些技术需要崇拜者和批评者。有人推动新事物向前发展是件好事,即使不是每个人都能参与其中。有反方戳穿也是好事。我认为,既有乐观主义者规划前进的新道路,也有悲观主义者确保自己不会直接跌落悬崖,这样的世界才会更加美好。

    1. 相对于它的无用性,加密货币还是很有价值的。
      除非你想象中的世界发生了全球冲突,而加密货币在头12个月内没有被关闭。

    2. 加密货币让那些原本受限于严苛的支付平台限制、拥有信用卡公司的清教徒道德主义者等的人们可以在网上买卖东西而不会被阻止。这显然不是一个好的系统,但它提供了一个高强度的释放阀,一个后备机制,希望能削弱其中一些严厉的措施。加密货币的存在帮助了很多人,尤其是最近很多坏人控制了支付平台,并经常随心所欲地关闭企业。
      至于是帮助了更多人还是伤害了更多人,还有待商榷,但加密货币肯定有其切实的用处,即使是小众的用处,也有其真正的价值。不过,它肯定没有价值。

      1. 有证据表明,情况恰恰相反。加密货币唯一真正有价值的东西就是价值储存。当然,比特币是一种不稳定的商品,但在任何一个 5 年的平均窗口期,比特币都绝对跑赢通胀。这使它成为一种安全的价值储存手段。

        1. Huh. 虽然我同意比特币在过去是一种成功的投机性投资,但 “安全的价值储藏 “就太夸张了。它和 S&P 500 指数基金一样,是一种安全的价值储存手段,只不过波动更大。那句话怎么说来着… “过去的表现并不代表未来的收益”

        2. 有什么证据?人们一直用它来绕过支付处理器卡特尔。

          1. Define all the time. 我还没见过接受加密货币的商店。我用它买不了什么东西。

      2. 很多坏人控制着大多数加密货币平台。他们中的一些人甚至理直气壮地烂在监狱里(直到特朗普赦免他们),他们中更多的人都该死在监狱里,而大多数人工智能用户并没有积极地犯罪、洗钱和挪用资金、逃税、抽水和倾倒地毯式拉动和金字塔式传销,以及实施欺诈。
        自从加密货币的骗子们终于闭上了他们喋喋不休的 “屎币”、“NFT ”和 “快速致富 ”传销计划的臭嘴之后,我们终于松了一口气。
        人工智能与加密货币完全不同,这是人工智能讨论,不是加密货币讨论。我已经听腻了 Crypto 骗子们大喊大叫的 HODL 和 FUD,而我实际上是在做有成效的工作,在用人工智能创造有形价值和提供有用产品的同时赚到了真金白银,甚至不需要不断地招揽更多的傻瓜,也不需要通过不停地兜售、抽水、倾销和从人们脚下拉地毯来骗取老年人和天真的傻瓜的毕生积蓄。

  5. 唯一精彩的部分是关于 “vibecoding”(令人不寒而栗的愚蠢术语)就像一个屁,会吸引苍蝇的笑话… 好吧,投资者
    不过,这种 “人工智能代码工具将淘汰真正的编程 “的鬼话总有一天会被人嘲笑,就像我们大多数人嘲笑屎币狂人一样
    只是很多人花了太长时间才学会

    1. 也许有一个不同的宇宙,在那里你写的代码并不指望能工作,所以你可以戳 LLM 整天,看看它是否会吐出什么东西来。
      我每天大部分时间都在阅读和思考,只有一小部分时间在真正写代码,因为当我打字的时候,我通常已经有了一个假设的解决方案,它的正确率高达 99%,而我只是在把它变为现实。或者我在重构。你可以随时打断我,我可以给你我正在做的事情的完整配方。
      这就是我不使用 LLM 的原因,因为这对我来说实际上是两倍的工作量。输入规格,然后验证和编辑给出的结果,而我可以先输入代码。而且他们的原型设计也很糟糕。有时,我可能想把某些东西保留在只有一个咒语起作用的原始状态,因为我对设计还不确定,并有一个 TODO 注释,但他们会生成一个更复杂的代码。以后再重构时会很麻烦。

      1. 我同意这个论点的精神,但我认为你没有考虑到我们现在谈论的 “类型化 ”的规模。
        例如,昨天我需要一个迷你语言的解析器。我写了一个语法–实际上甚至不是正式的语法,只是一些例子–以及我想要的 AST 的样子。我说 “写 tokenizer”,它就写了。我让它调整一些东西并编写测试。它照做了。我让它 “写一个递归下降解析器”,它照做了。添加测试并做一些调整,完成。
        整个过程只用了不到一个小时。
        所以,是的,我必须知道我需要一个解析器,但在这一点上,我几乎可以把细节交给它。(

        1. 这是个很酷的用例,可能为你节省了一些时间,但编写递归下降解析器是 CS 大一学生的实验作业。
          它并没有什么新的突破,也没有做任何你在谷歌上搜索不到的东西。

          1. 它们通常生成通用的 LALR 解析器,而不是自定义的递归下降解析器。我不是专家,但我的理解是,自定义递归下降解析器在可读性和错误信息生成方面具有优势。

      2. 我不同意,代理编码对于原型设计来说非常棒。它消除了大量的摩擦和惰性,让我可以尝试各种想法,看看哪些可行(从交付和/或用户体验的角度)。当然,你应该具备系统思维和经验,知道你在任何时候都在用它做什么,但对于演示和原型来说,它绝对是一个福音。
        一般来说,你也不会把规格书打出来,要么你向模型提供现有的规格书(以白板笔记、会议记录等形式),要么你以对话的方式反复推敲,直到达成初步的实施计划。
        这肯定是一种不同的工作方式,它有明显的缺点,需要不同的思维模式,这取决于你是否在进行绿色领域、演示/原型、现有大型应用功能开发等。

        1. 游戏设计就是一个很好的极端例子。
          当你在制作一款游戏时,尝试不同的想法,比如一个机制的几种不同的实现方式,成本真的很高。做一个改变可能要花费几个小时的时间。你往往要花费很多心思,从根本上调整一个机制,看看感觉如何,因为你很可能会把它扔掉。
          法学硕士在这方面非常擅长。创建一个 git 分支,让克劳德-代码(Claude Code)对物理机制进行调整,让它能做到 X,看看感觉如何。然后回滚修改或继续调整。
          对用户界面进行分支也是一样,看看不同的想法会是什么感觉。只需解释一下简单的改动,就可以花几个小时重构用户界面代码(苦差事),看看你是否喜欢这样的结果。或者直接让 LLM 来做,看看感觉如何,然后再回滚。

          1. >法律硕士在这方面真的很在行。创建一个 git 分支,让克劳德-代码(Claude Code)调整物理特性,使其达到 X,看看感觉如何
            你如何验证克劳德做了你想要的?
            也许更重要的是,如何验证克劳德没有做你不想要的改动?
            仅仅通过测试运行中的项目来验证代码的改动似乎是非常粗心大意的

            1. 你要阅读它做了什么,审查每一个改动,并要求它解释并从中学习,这样你也可以自己做:这与 “活力编码 “恰恰相反,后者的目标是不惜一切代价避免学习、阅读、审查和理解,过着粗心大意、不费吹灰之力的 TLDR 生活,过着自我强加的无知生活。
              使用人工智能工具有一种负责任的开明的自我充实方式,那就是 “Vibe 编码”。

              1. >你阅读它所做的一切,审查每一处改动,请它解释并从中学习,这样你也可以自己做了
                我不相信有人真的会长期以这种方式使用人工智能
                即使我们一开始就这样做,最终人们也会对它产生足够的信任,从而沾沾自喜,错误也会开始溜走
                除此之外,这听起来并不比自己编写代码快

                1. 是的,这就像自动驾驶仪和飞机的重演。
                  可惜的是,我们在这方面投入了大量资金和计算力,却继续忽视了所有可能有所帮助的人体工程学研究。

                2. 为自己说话。这就是我使用它的方式,因此我比那些懒惰、不想付出任何努力或学习任何新知识的 “活力编码员 “能从中获得更多,完成更多的工作。
                  使用 vi、Emacs 或 VSCode,你根本无法以同样的速度学习,而且它们也无法向你解释未知的代码、API、算法和错误修复,建议最佳实践,审查代码,为现有代码编写文档,检查代码并使其与更新的文档保持一致,或者自动更新现有文档和注释以反映实际代码。
                  现在,我正在使用 Cursor 重构和检修一个包含 Python、TypeScript、Bash、SQL、JSON、YAML、Markdown 和 ML 模型的庞大复杂的多版本库,从使用 Google Cloud Build 的多版本库到使用 GitHub actions 的单版本库、 我正在学习和应用大量的新知识,一丝不苟地记录系统的每个部分,使其坚如磐石、DRY,并进行大量的日志记录和错误处理,如果不使用人工智能,我根本无法在相同的时间内完成这些工作的 5%。你不必偷懒,相反,如果你愿意,你可以像没有人工智能时一样努力工作,在学习新知识的同时完成更多的工作。一切都取决于你。
                  如果你坚持不把它作为学习工具,不想努力工作,那你就是你,而我将比你或任何 “有活力的程序员 “更有优势。
                  你问:”如何验证克劳德做了你想做的事情?”我告诉你了。你懒得喝我给你倒的水,也不代表我或其他人不能喝。

        2. 通常,我自己的工作方式是用 Balsamiq[0] 制作视觉原型来测试流程,用 Figma|Sketch 制作用户界面规格,然后直接编码。这有点像画画,先涂鸦,直到有了几个可行的想法,然后反复斟酌这些想法,判断颜色和其他方面,最后确定一个最终结果。
          [0]: https://balsamiq.com/

    2. 是啊,说我是愤世嫉俗者、保守主义者或其他什么人都行–我看到了就会相信。我很少相信人工智能推销商对未来的预测,尤其是当他们说 “我们已经达到了 90% 的目标 “或 “如果事情以这样的速度发展下去,指数级的转变迫在眉睫 “时。摒弃观点,创造自己的东西,如果/当它奏效时再回来。
      现在一切都转变得太快了,反正也不重要。无论我花多少时间去学,几年后都会过时(预测情况会变得很好)。不过,如果你想销售人工智能产品,这确实很重要。那你就得说服人们,如果他们现在不使用你的新东西,他们就会错过机会,他们的生计就会受到威胁。

  6. 即使我同意这篇文章所说的一切,我也不知道作者是如何得出结论,认为初级开发人员会占上风,因为他们采用 LLM 的速度更快。
    他不是刚刚提到了形势发展的速度吗?去年我还对 AI 有一些 FOMO,现在没有了。我不在乎我没有时间充分探索当前的 LLM 技术水平,因为再过一个月它就会过时。我很乐意等到它稳定下来。
    如果他们的情况最终发生了,而你只需支付 N x K 美元就能将开发人员的生产力乘以 N,那你为什么还要选择初级开发人员呢?这样更便宜,但有时初级开发人员并不会花费更多时间来解决问题,而是永远不会(高级开发人员也一样,别误会我的意思,但这种情况发生得较少)。

  7. 这篇文章的大部分内容都很到位–但盲点却很成问题。
    在六个月后的代理人工智能乌托邦中:
    * 为什么要指派开发人员(尤其是初级开发人员)监督人工智能集群?这听起来更像是一个工程管理角色,需要亲力亲为。这是有道理的,因为实现预期成果所需的技能不再是 “如何编写代码让这些计算机正确工作”,而是 “在这个问题领域,什么才是对我们的客户和/或业务最有利的解决方案”。高阶思维、领域专业知识以及智慧比了解 React 钩子的复杂性更有价值。
    * 从经济学角度看,这些公司用这些代码做什么?代码仍然是负债,而不是资产。人类编写代码的速度比理解问题空间的速度更快,这已经是一个问题,而这里描述的勇敢的新世界让这个问题变得更糟,而不是更好。特别是在这里,如果所有问题都能在一天之内通过人工智能代理群 “解决”,那么就不再有经济 “护城河 ”来建立业务了。
    * 我对这些方法的长期扩展性表示怀疑。代价似乎是一开始极快的生产率,但随着产品的成熟和发展,生产率会断崖式下跌。这就像一栋大楼,一天之内就能建好几层,但很快就会达到上限,因为你的能力是建立在基础层之上的,而基础层则是理解不透的垃圾。
    * 天助运行人员/基础设施人员,他们不得不运行这些垃圾并大规模处理问题。
    顺便说一句,我并不排斥这篇文章中的所有内容–这些工具确实强大而引人注目,而且趋势线也是不可否认的。

  8. 我仍然需要适应这样一个事实:(sourcegraph.com) /item可能包含(steve-yegge.blogspot.com) 内容

  9. 这是我最近读到的最有趣的文章之一。也充满了一些道理。我认为学习如何使用人工智能将成为开发人员的核心部分,但我严重怀疑他们在解决问题方面的能力远不及初级工程师。不过,他们肯定能像初级工程师一样编写代码。
    我非常推荐大家阅读这篇文章–如果你还没有尝试过使用 cursor 或 copilot,不妨试试。它能让代码编写不再枯燥乏味。

  10. 一如既往,需要引用。
    (另外,还需要放点盐,因为这是一篇明目张胆的营销文章。)
    听着,自从谈论 “模型 “变得常见以来,我就一直听到 “模型会变得更好,让这些核心问题消失”。也许有一天会的!但同样重要的是,也许它们不会。
    你还必须考虑到这样一个未来:如果这些 “相信我,这次一定会实现 “的承诺没有实现,那么一些公司将为每位开发人员额外花费 5 万至 10 万美元,但他们却看不到任何所谓的性能提升。这样的赌注会让公司一蹶不振,所以看到有人犹豫不决,想看看足球是否会再次被踢走,也就不足为奇了。
    此外,我认为最令人震惊的是,这篇文章似乎采用了典型的技术官僚失败模式:将社会问题误认为技术问题。
    很显然,开发人员的确要解决技术问题,但这并不是他们的全部工作,而且在更高层次上,这已经成为他们最不重要的工作。越来越多的优秀开发人员会确保以正确的方式解决正确的问题。他们会与经理、(理想情况下)用户、其他团队等一大批人进行协商,以确保在正确的时间以正确的功能构建正确的东西,并做出正确的牺牲。法学硕士在这方面是典型的差劲。
    作者不屑一顾地将此称为 “卡壳”,并将其重要性一笔带过,说工程师一开始就能解开模型的卡壳(如果我们要让一大群 “会编码 “的初级工程师负责 LLMS,而他们在职业生涯中还没有足够的时间来培养这种技能,怎么可能呢?),然后提出 “但模型会变得更好 “的经典说法,并预测模型最终将能够做到这一点(如果这是 LLMS 的一个难以解决的问题–而目前的证据一直倾向于这种方式–那么又是如何做到的?)
    请原谅我这糟糕的语法。我太激动了。但请注意我在做什么: 我在问 “我们是否应该这么做?” 这些模型a)必须做得很好才能达到作者所暗示的效果,b)一直以来都做得很糟糕。
    我现在仍然持怀疑态度,因为这似乎是我与这些法学硕士相比仅存的一项超能力,我想,如果我想在作者的未来避开面包线,我就需要保持这项技能的敏锐性。)

  11. 我曾有过这样一幅颇为滑稽的画面:开发人员终于体验到了有人为你编写软件的感觉。你得到了你要求的东西,但对于最新手的用户来说,这显然是错误的。然后你改变了要求,得到了完全不同但同样错误或更糟的东西……还要重新开发票。

  12. LOL,相当不错,他有几次把我逗乐了。我相信会有很多人认真对待这件事,说明现在的情况有多可笑。

  13. 我从上到下读完了整篇文章,读到 80% 的时候,我仍然不能确定这篇文章是认真写的,还是十年来我见过的最犀利的讽刺作品。

  14. >我们认为,现在的招聘平淡只是公司发出的信号,他们还不知道该做什么。
    整篇文章似乎都是为初级开发人员写的,但其中有一句话让我很不爽:招聘平淡的原因是利率高,与公司想好如何使用 vibe 编码无关。
    就主题而言,这篇文章中没有任何关于 vibe coding 的基本有用信息,它只是为初级开发人员和入门级开发人员提供了一种更容易上手的方法。如果你是初学者,可以继续进行 vibe 编码,但也要尽力理解别人给你的代码。我强烈认为,这一点将(继续)使人们脱颖而出。

  15. 没有什么比没有数据的 “图表 “更像废话了

  16. 我认为很多人都会惊讶于使用代理进行 “氛围编码 “取代传统软件工程的速度之快。尤其是对于非关键软件,但最终安全问题也会变得非常重要,因为人工智能可以生成大量的测试用例。

    1. 关于代理的宣传铺天盖地,但我仍然完全不以为然。
      它们在完成基本任务方面还不错,但仅此而已。

    2. 而且没有任何传统的软件工程师,谁来检查这些测试用例是否真的有用并验证系统的重要属性?如果你的 Therac-25 有多少单元测试,却没有一个测试重要的东西,那也就无所谓了。

      1. 理论上,你也可以进行 E2E 测试,让人工智能代理也在用户界面上点击并截图,然后反馈给它。

        1. 这只是另一种类型的测试,问题是谁来检查这些测试是否真的测试了正确的东西。也许可以查一下刚才提到的 Therac-25。

  17. 只有我注意到了,还是有其他人注意到了?
    1) 最近光标每小时都会崩溃好几次。
    2)光标似乎忽略了 .cursorrules 文件。我使用的是 json 格式,它应该可以让你根据文件名模式进行过滤(虽然我不知道这对交叉代理的工作原理是什么)。
    3)光标沉迷于编写可疑的防御代码,检查最新的症状并试图猜测和摆脱困境,而不是解决真正的问题?要说服它停止这样做非常困难,我必须不断提醒它,告诫它不要再这样做了,要失败而不是缓解,要从根本上解决问题而不是治标不治本,不要在所有的马都跑掉之后还试图关上谷仓的门。就好像它只在 Stack Overflow 和 PHP 手册页面的讨论中受过训练一样。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注