Cursor founder: In the post-code era, "taste" will become more and more valuable

Cursor 的目标是创造一种全新的编程方式。

作者:Xin

作为有史以来增长最快的产品之一,Cursor 在发布仅 20 个月后就达到 1 亿美元 ARR。随后两年内,突破 3 亿美元的 ARR,并持续引领着工程师和产品团队开发软件方式的变革。截至 2025 年初,Cursor 拥有超过 36 万付费用户。

Michael Truell 是 Cursor 的母公司 Anysphere 的联合创始人兼 CEO。他和三个 MIT 同学一起创立了 Anysphere,用三个月时间推出了 Cursor。Michael Truell 极少接受播客采访,之前只上过 Lex Fridman Podcast。在本期内容中,他提到对「后代码(After code)时代」的预测、在搭建 Cursor 过程中那些反直觉的经验、以及对工程师未来发展趋势的看法。

本次内容来自 Lenny’s Podcast,以下是编译全文。

– Cursor 的目标是创造一种全新的编程方式:人们未来会看到更接近英语句式的伪代码。人对软件的各种细节都会拥有强大的控制力,有能力极快地进行修改、迭代。

-「品味」(taste)会变得越来越有价值:「品味」的核心是对「应该构建什么」有清晰的认知。

– 使用 AI 最为出色的那些用户,在技术应用上很保守:他们非常擅长将要交给 AI 的任务范围限定得更小、更明确。

– Cursor 面试的核心环节是一场为期两天的考核:这些考核项目是模拟的,但能够在两天里让候选人产生真正的工作成果。这不仅是一场「是否愿意与其共事」的检验,对于吸引候选人也非常重要。早期公司唯一能吸引人愿意加入的地方,往往就是一支令他们觉得值得一起奋斗的团队。

Chatbot 式编程的主要问题在于缺乏精确性

Lenny:我们之前聊到过,在后代码时代会发生什么。你如何看待 Cursor 未来的发展方向?技术将如何从传统代码转向其他形态?

Michael Truell:Cursor 的目标是创造一种全新的编程方式、一种与众不同的软件搭建方式。你只需用最简洁的方式向计算机描述你的意图,由你来定义软件应该如何工作以及如何呈现。

随着当今技术的不断成熟,我们相信可以开创一种全新的软件构建方法,这种方法将比现在水平更高、更高效、更易于使用。这一过程和今天写软件的方式将非常不一样。

我想将其与未来软件形态的几种主流观点进行对比,其中几种当下流行的观点我们并不太认同。

一种认为,未来软件构建仍将与今天非常相似,主要依靠使用 TypeScript、Go、C、Rust 等形式化编程语言进行文本编辑。另一种认为,你只需在聊天机器人里输入指令,让它帮你构建软件,再随时让它修改。这种聊天机器人的风格就像在和你的工程部门对话。

我们认为这两种愿景都有问题。

Chatbot 式的编程主要问题在于缺乏精确性。如果你希望人们能完全控制软件的外观和功能,你需要提供更精确的方式来指示它们做出想要的修改,而不是像在聊天框里对一个机器人说「改一下我应用的这个部分」,然后整个全被删除了。

另一方面,那种认为一切都不会改变的世界观也是错误的,因为技术只会越来越强大。在我们设想的「后代码」世界,软件逻辑的表达形式将更接近英语。

你可以想象它会以一种更规范的形式存在,朝着伪代码的方向发展。你可以编写软件的逻辑、在更高层面编辑它,并轻松地浏览它。这不会是难以理解、数以百万行计的晦涩代码。相反,它将更清晰、更易于理解和定位。我们正致力于让复杂的符号和代码结构演化成更易于让人阅读和编辑的形式。

后代码时代,品味会越来越有价值

Lenny:这很深刻,我想确保大家理解你的观点。你想象的转变是人们不会再看到代码,也不再需要以 JavaScript 或 Python 的形式思考。取而代之的是一种更抽象的表达形式,更接近英语句式的伪代码。

Michael Truell:我们认为它会最终发展到那个阶段。我们相信实现这个阶段需要现有专业工程师的参与和推动。未来人还是会在驾驶座上作为主导。

人对软件的各种细节都会拥有强大的控制力,也不会轻易放弃这种控制权。人们同时有能力极快地进行修改、迭代。未来不会依赖那种在后台发生、很慢的、需要数周才能完成的工程。

Lenny:这就引出了一个问题,对于目前的工程师,或者正在考虑进入成为工程师、设计师或产品经理的人来说,你认为在「后代码时代」里,哪些技能会越来越有价值?

Michael Truell:我认为「品味」(taste)会变得越来越有价值。人们谈到软件领域的品味时,很容易想到视觉效果,流畅的动画、配色、UI、UX 等等。

视觉对于产品而言非常重要。但正如之前提到的,我认为重要的另一半在于产品逻辑和运作方式。

我们有很多工具来设计视觉效果,但代码仍是软件运行逻辑的最佳的表达形式。你可以用 Figma 来展示效果,或者在笔记里大致勾画。但只有当你拥有真正可用的原型时,逻辑才能清晰呈现。

未来工程师将越来越像「逻辑设计师」。他们需要精准地表达意图,从幕后的「如何实现」转向高层次的「实现什么」、「是什么」,这意味着「品味」在软件开发中将更加重要。

目前在软件工程中我们还没有到那一步。网上流传着许多有趣且引人深思的段子,反映了人们过度依赖 AI 开发,软件有明显缺陷和功能问题。

但我相信,未来的软件工程师可以不用像现在这样过于注重细节控制,我们将慢慢从严谨细致转向更注重「品味」。

Lenny:这让我想到 vibe coding。这是否类似于你所描述的不必过多考虑细节,而是更顺其自然的编程方式?

Michael Truell:我认为两者有所关联。当前人们谈论的 vibe coding,在我看来描述的是一种备受争议的创作模式,即大量生成代码,却未能真正理解其细节。这种模式会带来不少问题。如果不了解底层细节,你很快会发现自己创造的东西变得过于庞大,难以修改。

实际上我们感兴趣的是:人们如何在不完全理解底层代码的情况下,仍能完美控制所有细节。这个解决方案和 vibe coding 息息相关。

我们现在还缺乏让「品味」真正主导软件构建的能力。Vibe coding 或类似模式的一个问题是,虽然你可以创造出一些东西,但很多是 AI 做出的笨拙的决策,你无法完全对其进行控制。

Lenny:你提到了「品味」。具体是指什么?

Michael Truell:对「应该构建什么」有一个清晰的想法。这个想法也能够越来越轻松地转化,这是你想创造的软件、它看上去是这个样子、是这样运行的。

不像现在,你和团队有了产品的构想、还需要一个翻译层,需要费尽心力和劳动力,把它转换成计算机能理解和执行的格式。

「品味」和 UI 的关系不大。或许「品味」这个词用得不太恰当,但其核心就是对「应该构建什么」有正确的认知。

Cursor 的诞生源于对一个问题的探索

Lenny:我想回顾一下 Cursor 的起源,很多听众可能还不知道它是如何诞生的。你们正在打造史上增长速度最快的产品之一。Cursor 正在深刻改变人们构建产品的方式,甚至正在改变整个行业。这一切是如何开始的?早期发展过程中有哪些难忘的时刻?

Michael Truell:Cursor 的诞生,源于我们对一个问题的探索,也很大程度上是我们对未来十年 AI 将如何变得更好的思考。其中有两个关键时刻。

第一个是初次使用 Copilot 的 Beta 版的时候。这是我们第一次接触到实用的 AI 产品,能实实在在带来帮助,而不是华而不实的 demo。Copilot 是我们迄今为止采用过的最有价值的开发工具之一,让我们也很激动。

另一个是 OpenAI 等公司发布一系列关于模型 Scaling 的论文。这些研究表明,即使没有颠覆性的新思路,仅仅通过扩大模型规模和增加训练数据量,AI 的能力也会越来越强。在 2021 年底到 2022 年初,我们对 AI 产品的前景充满信心,这项技术未来注定会走向成熟。

当我们环顾四周,发现虽然很多人都在谈论如何做模型,却少有人真正深入到一个具体的知识工作领域,去思考随着 AI 技术的进步,这个领域将如何进步。

这让我们想:当这项技术日益成熟,这些具体的领域在未来会发生怎样的变化?最终的工作形态会是怎样?我们将用来完成工作的工具将如何演变?模型需要达到怎样的水平才能支持这些工作形态的变化?一旦模型 Scaling 和预训练不能进一步提升了,我们又该如何继续突破技术能力的边界?

Cursor 在最初犯的错误是,我们一开始选择了一个竞争少、比较枯燥乏味的领域。没人会关注这种无聊的领域。

当时大家都认为编程很热门、很有趣,但我们觉得已经有很多人在做了。

最初有四个月的时间,我们实际做的是一个完全不同的项目——帮助机械工程实现自动化和增强,为机械工程师搭建工具。

但一开始就遇到了问题,我和我的联合创始人都不是机械工程师,虽然有朋友在这个领域,但我们对它极度陌生,可以说是「盲人摸象」,比如我们如何将现有的模型真正应用到机械工程中?我们当时的结论是,必须从零开始开发自己的模型。这种做法非常棘手,因为网上几乎没有关于各类工具和零件的 3D 模型及其构建步骤的公开数据,而要从拥有这些资源的渠道获取模型也同样困难。

但最终我们回过神来,意识到我们对机械工程没有很感兴趣,这并不是我们愿意奉献一生的事情。

回头看编程领域,尽管已经过去了相当一段时间,却并未出现显著变化。那些在这一领域工作的人似乎与我们的想法脱节,他们对未来的发展方向,以及 AI 将如何重塑一切缺乏足够的野心和远见。正是这些认识促使我们走上了构建 Cursor 的道路。

Lenny:我很喜欢这样的建议,比如去追逐那些看似无聊的行业,因为那里竞争少,存在机会,有时候这确实可行。但我更喜欢另一种思路——大胆追逐最热门、最受欢迎的领域,比如 AI 编程和应用开发,结果证明这也行得通。

你们觉得现有的工具缺乏足够的雄心或潜力,还有更多事情可以做。我认为这是一个非常有价值的启示。即使某个领域看似已经太晚了,像 GitHub Copilot 这种产品已经存在,如果你发现现有解决方案的野心还不够大、无法满足你的标准,或者在方法上存在缺陷,其中仍然蕴藏着巨大的机会。是这样吗?

Michael Truell:完全认同。我们想要实现突破性的进步,需要找到可以具体做的事情。而 AI 的迷人之处正在于,包括 AI 编程在内,很多地方依然存在着未知的巨大空间。

很多领域的天花板非常高。放眼望去,即使是拿任何一个领域里最好的工具来说,未来几年中仍有大量工作有待完成。拥有如此广阔的空间和如此高的上限在软件开发中是相当独特的,至少 AI 是如此。

Cursor 从一开始就强调 Dogfooding

Lenny:让我们回到 IDE(Integrated Development Environment,集成开发环境)的问题。你们有几种不同的路线、其它公司也都在尝试。

一种是构建一个面向工程师的 IDE ,并在其中集成 AI 能力。另一种是完全的 AI Agent 模式,例如像 Devin 这样的产品。还有一种就是专注于构建一个非常擅长编码的模型,致力于打造最好的编码模型。

是什么让你们最终决定 IDE 才是最佳路线?

Michael Truell:那些从一开始就只专注于开发模型,或试图实现编程的端到端自动化编程的人,他们试图构建的东西与我们截然不同。

我们更关注的是确保人们能够掌握他们所构建的工具中所有决策的控制权。相比之下,他们更多地在设想一个由 AI 完成整个过程的未来,甚至由 AI 来负责所有决策。

所以一方面,我们的选择包含了兴趣驱动的成分。另一方面,我们始终努力以非常现实的视角看待当前的技术水平。我们对 AI 未来几十年有的发展潜力感到无比兴奋,但有时人们会因为看到 AI 在某个领域表现出色,就倾向于将这些模型拟人化,认为它们在这个领域比人类更聪明,那在另一个领域也一定会出色。

但这些模型存在巨大的问题。我们的产品开发从一开始就强调「Dogfooding(自己使用自己的产品)」,我们自己每天大量使用 Cursor,从不希望发布任何对我们自己无用的功能。

我们本身就是产品的终端用户,让我们对当前技术水平有了现实的认知。我们认为让人坐在「驾驶位」至关重要,AI 不可能包揽一切。

因为个人原因,我们也希望赋予用户这种控制权。这样一来我们就不只是一个模型公司,也远离了那种剥夺人们控制权的端到端产品开发思路。

至于我们选择构建 IDE,而不是为现有的编程环境开发一个插件,是因为我们坚信编程将通过这些模型进行,并且编程方式将在未来几年会发生巨大变化。现有编程环境的可扩展性是如此有限,如果你认为 UI 和编程模式将发生颠覆性变化,那么你就必须对整个应用程序拥有全面的掌控权。

Lenny:我知道你们目前在做 IDE,也许这是你们的偏见,这是你们认为未来的方向。但我很好奇,你是否认为未来很大一部分工作会由 AI 工程师在 Slack 等工具中帮你完成?这种方式会有一天纳入 Cursor 吗?

Michael Truell:我认为理想状态是你能在这些事物之间轻松地切换。有时,你可能希望让 AI 自己独立运行一段时间;有时你会想将 AI 的工作成果拉取出来,与它高效协作。有时或许再次让它自主运行。

我认为你需要一个统一的环境,让这些后台和前台形式都能运行良好。对于后台运行,那些只需极少说明就能精准指定需求、判断正确标准的编程任务特别合适。修复 Bug 就是一个很好的例子,但这绝对不是编程的全部。

IDE 的本质会随着时间彻底改变。我们之所以选择打造自己的编辑器,正是因为它会不断进步。这种演变包括你能够从不同界面,如 Slack 及问题追踪的系统等接管任务;你日常盯着的这块玻璃屏幕本身也会发生巨大的变化。我们目前把 IDE 看作构建软件的地方。

使用 AI 最成功的用户在技术应用上反而很保守

Lenny:我认为人们在讨论 Agents 和这些 AI 工程师时,没有充分意识到的一点是,我们将很大程度上成为「工程经理」,手下管理着许多尚不那么聪明的下属,你必须花费大量时间进行审查、批准和具体说明需求。你对这个问题有什么看法?有没有什么方法可以简化这个过程?

因为听起来这真的很不容易,任何管理过大型团队的人都深有体会——「这些下属总是带着质量参差不齐的工作反复来找我,太折磨人了。」

Michael Truell:是啊,也许最终我们得跟所有这些 Agents 逐个进行一对一沟通。

我们观察到那些在使用 AI 时最成功的用户,他们在技术应用上反而比较保守。我确实认为,目前最成功的用户非常依赖像我们的「下一步编辑预测(Next Edit Prediction)」这样的功能。在他们常规的编程流程中,我们的 AI 会智能地预测下一步要执行的操作。他们还非常擅长将要交给 AI 的任务范围限定得更明确、更小。

考虑到你花在审查代码上的时间成本,与 Agent 的协作主要有两种模式。一种是你可以在前期花大量时间来详细说明,让 AI 独立工作,然后再去审查 AI 的成果。当你完成了审查,整个任务就完成了。

另一种是,你可以将任务切分得更细。每次只指定一小部分,让 AI 完成,然后审查;再进一步给指令,让 AI 继续完成,再审查。这就像在整个过程中实现了类似自动补全的功能。

不过,我们经常观察到,能最出色使用这些工具的用户依然倾向于将任务拆分,并保持任务的可管理性。

Lenny:这很难得。我想回到你们第一次构建 Cursor 的时候。你们在什么时候意识到它准备好了?什么时候觉得该发布出去看看会发生什么了?

Michael Truell:我们刚开始搭 Cursor 时,很担心会花费过长时间开发,迟迟不能向外界发布。Cursor 的最初版本完全是我们从零「手工打造」的。现在我们使用 VS Code 作为基础,就像许多浏览器使用 Chromium 作为核心一样。

但一开始并不是这样,我们从零开发了 Cursor 的原型,这其中包含了大量工作。我们不得不自己开发许多现代代码编辑器所需的功能,比如对多种编程语言的支持、代码间的导航功能、错误跟踪等。此外,还需要内置命令行,以及连接远程服务器以查看和运行代码的能力。

我们以闪电般的速度快速开发,完全从零开始构建了自己的编辑器,还同步开发了 AI 组件。大约在五周后,我们已经开始完全使用自己的编辑器,彻底扔掉了之前的编辑器,转而投入新工具的实践中。当我们觉得它达到一定实用性时,我们将它交给其他人试用,进行了一个非常短暂的 Beta 测试。

从写下第一行代码到正式向公众发布,Cursor 仅用了大约三个月的时间。我们的目标是尽快将产品交到用户手中,并在公众反馈中快速迭代。

令我们意外的是,原本以为这款工具会在很长时间内只吸引几百名用户,但从一开始就有大量用户涌入,带来了许多反馈。最初的用户反馈极为宝贵,正是这些反馈促使我们决定放弃从零构建的版本,转而基于 VS Code 开发。从那以后,我们一直在公众环境中不断优化产品。

三个月推出产品一年 ARR 达一亿美元

Lenny:我很欣赏你对所得成绩的低调。据我所知,你们在大约一年到一年半的时间内,就将 ARR 从 0 提升至一亿美元,这绝对是历史性的成就。

你认为成功的关键要素是什么?你刚提到自己使用自己的产品是其一。但你们能在三个月内就推出产品太不可思议了。这背后的秘诀是什么?

Michael Truell:第一个版本,也就是三个月时完成的版本并不完美。所以我们一直有一种持续的紧迫感,总觉得还有很多地方可以做得更好。

我们的终极目标是真正创造一种全新的编程范式,能够将我们今天所熟知的大量编码工作自动化。无论 Cursor 目前取得了多大进展,我们都觉得离那个终极目标还很遥远,总有很多事情需要去做。

很多时候,我们并没有过分纠结于最初的发布效果,而是更关注产品的持续演进,致力于不断改进和完善这款工具。

Lenny:在那三个月之后,是否有一个转折点,使一切开始起飞?

Michael Truell:说实话,一开始的增长感觉相当缓慢,也许是因为我们自己有些不够耐心。但就整体增长速度而言,它始终不断令我们惊讶。

我认为其中最令人意外的是,这种增长其实一直保持着稳定的指数级趋势,每个月都保持着持续增长,虽然新版本发布或其他因素有时会加速这一进程。

当然,这种指数增长在初期感觉相当缓慢,基数也确实很低,所以一开始它并没有真正呈现出突飞猛进的态势。

Lenny:这听起来就像是那句「创造它,人就会随之而来」的例子。你们只是打造了一个自己喜欢的工具,一经发布,大家也很喜欢,才口口相传。

Michael Truell:是的,差不多就是这样。我们团队将大部分精力投入到产品本身,没有分心去做其他事情。当然,我们也花时间做了很多其他重要的事情,像建立团队、轮岗负责用户支持等。

然而,对于很多初创公司在早期会投入精力的一些常规工作,我们「就把问题搁那儿了」,尤其是在销售和营销。

我们把精力都放在打磨产品上,先打造一个让自己团队喜欢的产品,再根据一部分核心用户的反馈进行迭代,这听起来或许很简单,实际上要做好却并不容易。

有很多方向可以探索,很多不同的产品路线。难点之一在于保持专注,战略性地选择要构建的关键功能,并确定优先级。

另一个挑战在于,我们所处的领域本身就代表一种全新的产品开发模式:我们介于一家传统软件公司和一家基础模型公司之间。

我们在为数百万用户开发产品,这要求我们在产品层面做到极致。但产品质量的另一个重要维度,在于不断深化科学研究与模型开发,在关键场景中不断优化模型本身。平衡这两方面始终充满挑战。

最反直觉的事是没预料到会自研模型

Lenny:到目前为止,在构建 Cursor、搭建 AI 产品方面,你觉得最反直觉的事情是什么?

Michael Truell:对我来说最反直觉的一点,就是我们一开始完全没预料到会自己开发模型。当我们刚进入这一领域时,早就有公司从一开始专注于模型训练了。而我们计算过为训练 GPT-4 所需的成本和资源,很清楚这不是我们有能力做到的事情。

市面上已经有很多出色的模型了,何必要费尽心力去复制别人已经做好的事情呢?尤其是在预训练(Pre-training)方面,这需要让一个对任何事情都一无所知的神经网络学习整个互联网。因此,我们起初完全没打算走这条路。从一开始我们就很清楚,现有的模型有很多本可以做到的事情还未能实现,因为缺乏为这些模型搭建的合适的工具。但我们还是投入了大量精力进行模型开发。

因为你在使用 Cursor 时感受到的每一个「神奇时刻」都多少源自我们的定制模型。这个过程是循序渐进的。我们最初在一个用例上尝试训练自己的模型,因为它使用任何主流的基础模型都不太合适,结果很成功。随后我们又将这种思路推广到另一个用例,也很不错,之后便不断推进。

在进行这类模型开发时,一个关键要点是精准地选择目标,不去重复造轮子。我们不碰那些顶尖基础模型已经做得非常好的领域,而专注于它们的短板,并思考如何去补足。

Lenny:很多人听到你们拥有自己的模型时会感到惊讶。因为当人们谈论 Cursor 及这个领域的其他产品时,经常称它们为「GPT 套壳」,认为它们只是搭建在 ChatGPT 或 Sonnet 这类模型之上的工具。但你提到了,你们其实有自己的模型。能聊聊这背后的技术栈吗?

Michael Truell:我们确实在多种场景下都会使用最主流的基础模型。

为用户提供 Cursor 体验的关键环节,我们更多地依赖自研模型,比如一些因基础模型的成本或速度原因无法胜任的用例。一个例子就是自动补全。

对于不写代码的人来说,这一点可能不太好理解。写代码是一种独特的工作。有时候,你未来 5 分钟、10 分钟、20 分钟甚至半小时内的工作内容,完全可以通过观察你当前的操作来预判。

和写作对比起来,或许很多人熟悉 Gmail 的自动补全功能,以及编辑短信、邮件等文本时出现的各种自动补全提示。但这些功能的作用有限。因为仅通过已写内容,往往很难推断出你接下来要写什么。

但写代码的时候,当你修改了代码库的某一部分时,往往需要同步修改代码库的其他部分,而且这些需要修改的内容是很明显的。

Cursor 的核心功能之一就是这种增强版的自动补全。它能跨多个文件、跨文件内的不同位置,预测你下一步要执行的一系列操作。

要让模型在这个场景下表现出色,它的速度必须足够快,能确保在 300 毫秒内给出补全结果。成本也是一个重要因素,我们每次按键都要触发成千上万次推理,不断更新对你下一步操作的预测。

这还涉及一个非常特殊的技术挑战:我们需要模型不仅像处理普通文本序列那样能补全下一个 token,而是要擅长补全一系列 diffs(代码改动),即根据代码库中已发生的修改,预测接下来可能发生的增删改动。

我们对这个任务专门进行了模型训练,非常有效。这一部分完全是我们自主研发,从未调用任何基础模型。我们没有对这套技术进行标签或品牌宣传,但它是 Cursor 的核心。

我们使用自研模型的另一种场景,是用来增强像 Sonnet、Gemini 或 GPT 这类大模型的表现,尤其是在输出和输入。

在输入环节,我们的模型会搜索整个代码库,识别出需要展示给这些大模型的相关部分。你可以把它想象成一个专门用来在代码库里查找相关内容的「迷你 Google 搜索」。

在输出环节,我们会处理这些大模型给出的修改建议,用我们专门训练的模型来补充完善细节。比如高层级的逻辑设计由更先进的模型完成,它们会花费一些 token 来给出总体方向。另外一些更小、更专业、速度极快的模型则会结合着一些推理优化技巧,将这些高层级的修改建议转化为完整、可执行的代码转换。

这样的做法大幅提升了专业化任务完成的质量,也极大地加快了反应速度。对我们来说速度也是衡量我们产品的关键指标。

Lenny:这很有意思。我最近在播客里采访了 OpenAI 的 CPO(首席产品官)Kevin Weil,他把这称作集成模型(Ensemble of models)。

他们同样会利用每个模型最擅长的功能。使用更廉价的模型在成本上会极具优势。你们自己训练的这些模型,是基于 LLaMA 之类的开源模型进行开发吗?

Michael Truell:我们在这方面非常务实,不想重复造轮子。因此我们会从市面上最优秀的预训练模型入手,通常是开源,有时也会与不向外界开放权重的大模型合作。我们不太关心能否直接读取或按行查找那些决定输出结果的权重矩阵,而是更在意对模型进行训练、后训练(Post-train)的能力。

AI 产品的天花板就像上个世纪的个人电脑和搜索引擎

Lenny:很多 AI 创业者和投资人都在思考一个问题:AI 的护城河和防御能力在哪里?定制模型似乎是建立护城河的一种方式。在竞争对手试图不断推新、抢你饭碗的情况下,如何习得长期防御能力?

Michael Truell:我认为确实有一些传统方法来建立用户惯性以及护城河。但说到底,我们必须持续努力,打造最出色的产品。我坚信 AI 的天花板非常高,无论你构建怎样的壁垒,都随时可能被超越。

这个市场与过去的传统软件市场或企业市场有些不同。和这个市场类似的一个例子是 20 世纪 90 年代末到 21 世纪初的搜索引擎。另一个则是七八十年代到九十年代个人电脑和小型计算机的发展。

AI 产品的天花板非常高,产品快速迭代。你可以持续地从一个聪明人每一个小时的增量价值、每一美元研发费用的增量价值中获得巨大的产出。这种状态可以持续很长时间。你永远不会缺少要开发的新功能。

尤其在搜索领域,增加分发渠道也有助于产品的改进,因为你可以根据用户数据和反馈来持续迭代算法和模型。我相信这些动态变化也存在于我们所处的行业。

对我们来说,这或许是一个略带无奈的现实。但对整个世界而言却是令人振奋的真相。未来还会涌现出许多领军产品,还有太多有意义的功能等待被创造。

我们距离五到十年后的愿景还有很远的距离,我们要做的是保持创新引擎的高速运转。

Lenny:听起来这更像是建立一种「消费者式」的护城河。持续提供最佳产品,让用户愿意一直使用,而不是像 Salesforce 那样,通过与整个公司绑定合同,让员工不得不使用。

Michael Truell:是的。我认为关键在于如果你所处的领域很快就没有多少有价值的东西可做了,那情况确实不太乐观。但如果在这个领域,大量资金投入、杰出人才的努力能持续产出价值,那么你就能够享受到研发上的规模效应、能够在正确的方向上深入技术、构建壁垒。

这确实也带有一定的消费者导向的趋势。但这一切的核心在于打造最优秀的产品。

Lenny:这你认为未来会是一个「赢家通吃」的市场,还是会涌现出许多差异化的产品?

Michael Truell:我认为这个市场非常巨大。你之前提到 IDE 的情况。有些人研究这个领域时,会回顾过去十年的 IDE 市场,然后问:「究竟有谁能靠做编辑器赚钱?」过去每个人都有自己习惯的配置。只有一家公司通过打造出色的编辑器实现了商业化盈利,但它的规模也十分有限。

一些人因此得出结论,觉得未来也会是这样的格局。但我认为这种看法忽略了一件事,就是在 2010 年代,为程序员搭建编辑器的潜力是有限的。

那家靠编辑器赚钱的公司主要专注于简化代码库导航、检查错误、做好用的 Debugging 工具。虽然这些功能都很有价值,但我认为为程序员、乃至更广泛的各领域知识工作者搭建工具,其中的机会是巨大的。

我们面对的真正挑战是如何自动化大量繁琐的事务性和知识性工作。这样才能在各个知识工作领域实现更可靠、更高效的生产力提升。

我认为我们所处的市场规模非常大,远超过去人们对开发者工具市场的认知。未来会有各种各样的解决方案出现,也可能会出现一家行业领导者。可能是我们,但还有待观察。这家公司会创建出一个通用工具,能够协助搭建世界上大部分的软件,这将是一家具有时代影响力的大型企业。但同时也会存在专注于特定细分市场、或软件开发生命周期的特定环节的产品。

最终,编程本身可能会从传统的正式编程语言编写,转向更高层次,而这类高阶工具也将成为用户购买和使用的主要对象。我相信,AI 编程会出现一个主导者,它将发展成为一家规模极其庞大的企业。

Lenny:很有趣的是,Microsoft 之前位于这场变革的中心,它有很棒的产品和强大的分发渠道。你说 Copilot 让你意识到这个领域潜力巨大,但它似乎并没有完全赢下这个市场。甚至有些滞后了。你认为原因是什么?

Michael Truell:我认为 Copilot 之所以未能完全达到期望,这背后有特定的历史原因和结构性原因。

从结构性角度来看,Microsoft 的 Copilot 项目给我们带来了巨大的启发。他们做了很多了不起的事,我们自己也是很多 Microsoft 的用户。

但我认为这个市场对于成熟企业来说并不那么友好。对它们友好的市场往往是那些创新空间不大、很快就可以商业化、可以通过捆绑产品销售来获利的市场。

在这种市场里,不同产品之间的 ROI 差别并不大。购买独立的创新解决方案的意义不大,反而捆绑销售的产品更具吸引力。

另一种对成熟企业特别有利的市场是:用户从一开始就高度依赖你的工具,且切换成本非常高。

但是在我们的领域,用户可以轻松尝试不同的工具,根据自己的判断选择哪个产品更适合自己。这种情况对大公司不太有利,反而对那些拥有最具创新性产品的公司更友好。

至于具体的历史原因,据我了解,最早参与 Copilot 第一版开发的团队,他们大多数人后来去了其它公司做其它事情了。在所有相关部门和相关人员之间协调,一起来做一个产品,确实是存在困难的。

高级工程师期望太低入门工程师期望太高

Lenny:如果你能坐在每个第一次使用 Cursor 的新用户旁边,在他耳边悄悄说几句建议,帮助他们更好地使用 Cursor,你会说些什么?

Michael Truell:我认为目前在产品层面上,我们需要解决一个问题。

现在很多能够成功使用 Cursor 的用户都对模型的能力有一定「品味」。这些用户了解 Cursor 能完成什么程度的任务,也明白需要向它提供什么程度的指令。他们能理解模型的质量、局限性、能做什么和不能做什么。

在现有产品中,我们并没有做好这方面的用户教育,甚至没有提供明确的使用指南。

为了培养这种「品味」,我有两个建议。

第一,不要一次性向模型下达全部的任务。你对输出要么大失所望,要么全盘接受。相反,我会把任务切成小块。你可以花同样的时间来得到最后的结果,但要分步进行。一次只明确少量任务、拿到一部分成果、重复这个过程,而不是试图编写一大段冗长的指令。这种做法很可能会导致灾难。

第二,最好先在业余项目上尝试,不要直接用于重要工作。我会鼓励那些习惯于现有开发流程的开发者多有些失败经验,也多去尝试突破模型的上限。

他们可以在一个相对Safety的环境中,比如在副业里尽可能地利用 AI。很多时候,我们发现有些人还没有给 AI 一个公平的机会,并且低估了它的能力。

通过采用分解任务的方法,并主动去探索模型的边界,在一个安全的环境中尝试突破。你可能会惊讶的发现在一些场景中,AI 并不像你预想的那样会出错。

Lenny:我的理解是,要培养一种直觉,去了解模型的能力边界、它能将一个想法推进到什么程度,而不是仅仅按你的指示行事。而每当有新模型发布时,比如 GPT-4 出来的时候,你都需要重新建立这种直觉?

Michael Truell:确实如此。过去这几年,这种感觉可能没有像人们第一次接触大模型时那样强烈了。但这确实是我们希望将来为用户更好地解决的一个痛点,减轻他们的负担。不过,每个模型都有略微不同的怪癖和个性。

Lenny:人们一直在讨论,像 Cursor 这样的工具,对入门工程师帮助更大,还是对高级工程师帮助更大?它们是能让高级工程师的工作效率提升十倍,还是能让初级工程师变得更像高级工程师?你觉得现在哪一类人使用 Cursor 获益最大?

Michael Truell:我认为两类工程师都能获得巨大的收益,很难说哪一类受益更多。

他们会陷入不同的「反模式」(Anti-patterns)。初级工程师有时会过于依赖 AI,什么都让它去做。但我们目前还并不具备在专业工具上、与几十甚至上百人协同、在一个长期维护的代码库中端到端使用 AI 的条件。

至于高级工程师,虽然并非所有人都如此,但这些工具在公司中的采用往往会被一些极其资深的人所阻碍,比如一些开发者体验团队。因为他们通常负责开发工具,来提高组织内其他工程师的生产力。

我们还看到了一些非常前沿的尝试,有些高级工程师走在最前面,尽可能地拥抱并利用这项技术。平均来说,高级工程师往往会低估 AI 对他们的帮助,并倾向于固守现有的工作流程。

很难断定哪类人群受益更大。我认为两类工程师都会遇到各自的「反模式」,但他们都能从使用这类工具中获得显著的益处。

Lenny:这完全有道理,就像光谱的两端,一个期望过高,一个期望不足。就像三只熊的寓言。

Cursor 招聘核心是一个为期两日的考核

Lenny:在创立 Cursor 之前,你希望自己知道什么?如果你能回到 Cursor 刚开始的时候,给当时的 Michael 一些建议,你会告诉他什么?

Michael Truell:难点在于很多宝贵的经验是隐性的,很难用语言描述。遗憾的是,在人类的某些领域确实需要亲身失败才能学到教训,或者你需要向该领域的佼佼者学习。

我们在招聘上就深有体会。事实上我们在招聘方面极为耐心。对我们来说,无论是出于个人愿景还是公司战略,拥有一支世界一流的工程师和研究人员团队一起打磨 Cursor 至关重要。

因为需要搭建很多新的东西,我们希望找到那些兼具求知欲与实验精神的人才。我们也寻找那些实事求是、适度的审慎以及坦率直言的人。随着公司和业务规模的不断扩张,各种噪音会越来越多,保持清醒的头脑格外重要。

产品之外,找到合适的人加入公司可能是我们最关注的事情,也正因为如此,我们在很长一段时间里都没有扩大团队。很多人都说招聘速度太快会出问题,但我认为我们一开始的招聘速度太慢了,我们本可以做得更好。

我们最终使用的招聘方法对我们非常有效,就是专注于寻找我们认定的世界一流的人才,有时甚至会花好几年去招募。

我们在很多方面都积累了宝贵的经验,比如如何判断理想的候选人、谁能真正融入团队、卓越的标准是什么,以及如何与那些并未积极寻找工作的人沟通并激发他们的兴趣。为了学习做好这些,我们确实花费了不少时间。

Cursor 创始人:后代码时代,「品味」将越来越有价值

共同创立 Anysphere 的 4 位 00 后,分别为 Aman Sanger、Arvid Lunnemark、Sualeh Asif 和 Michael Truell

Lenny:对于现在正在招聘的公司来说,你有什么经验可以分享?你错过了什么,学到了什么?

Michael Truell:一开始我们过于倾向于寻找符合名校背景画像的人才,尤其是那些在知名学术环境中取得优异成绩的年轻人。

我们很幸运地在早期找到了一些非常出色的人。他们在职场上已经非常资深,却仍愿意一起做这件事。

我们刚开始招聘时过分强调兴趣和经验。虽然我们已经雇佣了许多优秀而有才华的年轻人,但他们和直接从舞台中央走出来的资深阵容是不一样的。

我们对面试流程也做了升级。我们有一套专门定制的面试题。核心环节是让候选人来到公司待两天,和我们一起做一个为期两天的考核项目。这种方法非常有效,我们也在不断优化它。

我们也在不断了解候选人的兴趣所在、提供有吸引力的条件,并在对方还没有求职意向时展开对话,向他们介绍工作机会。

Lenny:你有没有特别喜欢的面试问题?

Michael Truell:我原本以为这个为期两天的工作考核不会适用于太多人,但它展现出了出人意料的持久的生命力。它能让候选人从头到尾参与其中,就像完成一个真实项目一样。

这些项目是固定的,但能够让你用两天时间看到真实的工作成果。而且这不会占用团队大量时间,你可以把原本半天或一天现场面试的时间,分散到这两天里,让候选人有充足的时间完成项目。这样反而可以更容易规模化。

两天的项目更是一场「是否愿意与此人共事」的检验。毕竟你们要待两天,期间还得一起吃几顿饭。

最初我们并没有料到这个考核会延续下来,但它现在是我们招聘流程中很有价值的环节。这对于吸引候选人也非常重要,尤其在公司初期,在产品尚未大范围使用、质量还不够成熟时,唯一能吸引人愿意加入的点,往往就是一支令他们觉得特别、值得一起奋斗的团队。

两天的时间会让候选人有机会了解我们,甚至可以让他们相信自己想加入我们。这个考核带来的效果完全超出预期。它不算是严格意义上的面试问题,更像是一种前瞻性的面试模式。

Lenny:这个终极面试问题,是你给他们一个任务,比如在我们的代码库中构建某个功能,与团队合作编码并发布,是像这样吗?

Michael Truell:差不多是的,我们不会使用 IP,也不会将项目成果直接并入产品线,是一个模拟项目。通常会在我们的代码库中安排一个真实的、为期两天的迷你任务,他们会独立完成端到端的工作,当然也有协作的环节。

我们是一家很注重线下协作的公司,基本在所有情况下,他们都会坐在办公室里和我们一起完成项目。

Lenny:你提到这种面试方式一直在延续,你们团队有多大了?

Michael Truell:我们大概有 60 人。

Lenny:考虑到你们的影响力,这个规模真的不大,我以为会大很多。我猜工程师人数最多。

Michael Truell:我们接下来最重要的工作之一,就是组建一支更庞大、更优秀的团队,从而持续优化产品、提升客户服务质量。所以我们并不打算长期保持这么小的规模。

我们团队人数较少的部分原因在于,公司内部的工程师、研发和设计人员占比非常高。许多软件公司在拥有大约 40 名工程师时,总人数往往会超过 100 人,因为存在大量运营工作,且这类公司通常从一开始就非常依赖销售,这需要大量的人力。

而我们从一开始就采取了极度精简、以产品为核心的模式。如今,我们服务于众多市场客户,并在此基础上不断扩展。不过,我们未来还有很多工作要做。

Lenny:AI 领域正经历着翻天覆地的变化,每天都有新鲜事、有很多 newsletter,告诉你 AI 每天都发生了什么。管理一家热门的、核心的公司,你如何保持专注?如何帮助你的团队心无旁骛地工作、深耕于产品,而不被这些层出不穷的新事物分心?

Michael Truell:我认为招聘是关键。重点在你能否招到态度正确的人。我相信我们在这方面做得不错,或许还可以做得更好。

这也是我们在公司内部更多讨论的问题,招聘性格合适的人很重要。他们不应过度关注外界认可,而更专注于打造卓越的产品、提供高质量工作,并且总体上保持头脑冷静,情绪不会大起大落。

招聘可以帮助我们应对许多挑战,这也是公司上下的共识。任何组织都需要流程、层级和诸多制度,但对于引入公司的任何组织工具而言,若想实现其预期效果,很大程度上可以通过招聘具备相应特质的人来达成。

一个例子是,我们在工程领域没有太多流程却依然运转良好。我认为我们需要增加一些流程。但因为公司的规模小,只要招聘真正优秀的人才,就无需设置过多流程。

第一是要招聘沉着冷静的人。第二是要充分沟通。第三是要做好表率。

从 2021 到 2022 年,我们一直在专注于 AI 工作。我们目睹了各种技术和理念的重大变化。如果你能回到 2021 年末或 2022 年初,当时有 GPT-3,而 InstructGPT 并不存在,DALL-E 和 Stable Diffusion 也尚未出现。

所有这些图像技术的诞生、InstructGPT 的出现、GPT-4 的发布,以及各种新模型、各种不同技术、模态、视频相关技术的涌现。只有极少数对我们的业务产生了影响。我们已经建立了一定的免疫力,知道哪些进展对我们真正重要。

即使存在大量的讨论,只有少数事情真正重要。过去十年中 AI 领域也反映了这一点,学术界发表了大量关于深度学习、AI 的论文。但令人惊叹的是,AI 的许多进步源于一些非常简单、优雅且经久不衰的想法。而绝大多数提出的想法,既没有经得起时间考验,也未能产生显著影响。现在的动态与深度学习作为一个领域的发展有些相似。

对工程师的需求量只会越来越大

Lenny:人们对 AI 的发展方向以及它将如何改变世界,仍然存在哪些误解?或者尚未充分理解的地方?

Michael Truell:人们仍然有些过于极端的观点,要么认为一切都会非常快发生,要么认为这一切都是炒作和夸大。

我们正处于一场影响极为深远的技术变革之中,其重要性将超过互联网,也超过自计算机诞生以来我们所看到的任何技术变革。但这场变革需要时间,它将是一个持续数十年的进程,许多不同的团队将在推动其发展方面发挥重要作用。

要实现计算机能为我们分担越来越多工作的未来,我们需要解决所有这些独立的技术难题,不断攻克。

其中一些属于科学层面的挑战,例如让模型理解不同类型的数据,变得更快、更便宜、更智能,更适配我们关注的模态,并在现实世界中采取行动。

还有一些问题关乎人机协作,思考人在电脑上究竟应该看到、控制、与这些技术进行怎样的交互。我认为这需要数十年的时间,有大量令人激动的工作需要完成。

我认为有一类团队将会尤其重要。这不是自吹自擂,但这些公司要专注于为特定知识工作领域实现自动化,为该领域构建底层技术且整合最佳的第三方技术。有时也要自主研发,打造相应的产品体验。

这类团队的重要性不仅体现在对用户的价值上,而是随着规模扩大,它们将对技术进步起到关键推动作用。其中最为成功的团队将有能力构建起庞大的企业,我也期待看到其它领域涌现出更多类似的公司。

Lenny:我知道你们正在招聘对「我想在这里工作并打造这类产品」有兴趣的人。你们现在正在寻找什么样的人?具体在招募哪些人或职位?哪些职位你们最希望尽快招到?如果有人对此感兴趣,需要了解哪些信息?

Michael Truell:我们团队需要完成的事情太多了,但很多事还没有做。我们有很多要做的,如果你觉得我们好像并没有正在招募某个特定的岗位,不如先来联系我们。也许你能给我们带来新的思路,让我们意识到没有注意到的空缺。

我认为今年最重要的两件事,一个是打造这个领域里最优秀的产品,第二是增长。我们正处于抢占市场份额的阶段,目前全球范围内,几乎所有人要么还没有使用我们的同类工具,要么在使用发展速度较慢的别人的产品。推动 Cursor 的增长是一个重要的目标。

我们一直在招优秀的工程师、设计师和研究人员,同时也在找其它人才。

Lenny:有一种说法是 AI 将取代工程师来完成所有代码。但这和现实形成了鲜明对比,大家还在疯狂招聘工程师,包括开发基础模型的公司也是如此。你认为是否会出现一个转折点,对工程师的需求开始放缓?

我知道这是一个很大的问题,你是否认为所有公司对工程师的需求会越来越大?还是说,你认为在某个阶段,会有大量 Cursor 运行起来,来完成开发工作?

Michael Truell:我们始终认为这是一个漫长而复杂的过程,不会一步到位,直接实现那种你只需要下达指令,AI 就能完全取代工程部门的状态。

我们非常希望推动编程的方式平稳演进,始终让人占据主导地位。即便在最终状态下,赋予人对一切的掌控权依然至关重要,而需要专业的人来决定软件的应有的形态。所以我认为工程师不可或缺,他们将能够做更多的事情。

对软件的需求是持久的。这不是什么新鲜事,但试想一下,构建那些看似简单、易于定义的东西,成本和人力消耗反倒超乎想象。至少在外行眼中,这些东西本该不难完成,而实际要做好却很难。如果你能将开发成本与人力投入再降低一个量级,那便能在电脑上实现更多新的可能,开发出无数新的工具。

我对此深有体会。我曾经在一家生物技术公司工作,负责为其开发内部工具。当时市面上的工具体验极差,完全无法满足公司的需求。而我能够搭建的内部工具的需求量极大,远远超过我个人的开发能力。

计算机本身的物理性能早已足够强大,它理应能让我们随心所欲地移动或搭建任何想要的东西,但现实中却存在太多阻碍。对软件的需求远超目前的开发能力,因为开发一个简单的生产力软件可能需要像拍一部大片那样昂贵的成本。因此在遥远的未来,对工程师的需求只会越来越大。

Lenny:还有什么我们没有提到但你想补充的吗?有什么想留给听众的智慧结晶吗?

Michael Truell:我们一直在思考如何建立一个团队,使其既能创造新事物,又能持续改进产品。如果我们想取得成功,IDE 必须做出很大的改变。它未来的形态也必须有很大不同。

如果你去看我们引以为榜样的公司,一定能看到持续引领多次技术飞跃、不断推动行业前沿的案例,但这样的公司少得很。

我们一方面需要在日常工作中思考相关问题,从第一性原理的角度进行反思。深入研究过去成功的案例也很重要,这也是我们经常思考的问题。

Lenny:我注意到你身后有很多书,其中一本是关于一家老牌计算机公司的历史,它在很多方面极具影响力,但我从来没有听过。这让我深有感触,因为许多创新的思考往往源于对历史的回顾,对过往成功与失败案例的研究。

如果有人想联系你们或申请职位,应该如何在网上找到相关信息?你提到可能存在一些他们还没意识到的岗位,他们该去哪里了解?听众怎样才能为你们提供帮助?

Michael Truell:如果有人对这些岗位感兴趣,在 cursor.com 上可以找到我们的产品和联系方式。

Lenny:太好了。Michael,非常感谢你今天的到来。

The article comes from the Internet:Cursor founder: In the post-code era, "taste" will become more and more valuable

share to
© 版权声明

相关文章