Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

All articles10个月前更新 wyatt
61 0 0
吕骋:确实从硬件上make money,R1 是通过必要性而非偏好选择硬件的结果,使用的是神经符号模型而非 LLM。

这是 Rabbit CEO 吕骋(Jesse Lyu)在 CES 后在《This Week Startup》节目上与硅谷知名天使投资人 Jason Calacanis 最新对话,长达 90 分钟的对谈详细描述了他最新的产品思考。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

吕骋强调了技术的演进是为了解决相同的问题,但以更直观的方式。他详细介绍了 LAM (Large Action Model)的工作原理, LAM 旨在提高效率、节省时间,这是一个真正的时间节省装置,让用户更多地专注于其他事情,这一理念是公司的核心驱动力。

此外,他还分享了个人 10 多年前开始的硬件创业的挑战,以及硬件创业现在与过去的不同之处,讨论了硬件迭代周期的缩短、深圳等地的制造能力,以及对低延迟技术对 AI 和数据中心能源消耗潜在影响的担忧。

以下为这次对谈的全部内容:

Jason Calacanis: 上周我们讨论了 Rabbit R1 ,它是 CES 上最值得关注的新产品之一,这是在拉斯维加斯举办的消费电子展览,也许你们在 X/ Twitter 上看过它的演示视频,这是一个看起来非常酷的产品,是一款便携式 AI 伴侣,可以放在口袋里。

它上面有一个用于导航的轮子,有一个可以翻转的摄像头,还有一个 LED 屏幕,我猜的,还有一个明亮漂亮的橙色,是我最喜欢的颜色,它是当场的明星产品。

他们进行了很棒的演示,今天我们邀请创始人来谈谈这个产品。在某些方面,它真的有点复古,但它拥有自定义的 LLM 和 200 美元的价格,让所有人都兴奋不已。

他们已经卖出了超过 6 万台这样的设备。在过去的五天里,他们每天都在卖出大约 1 万台。Rabbit 创始人 Jesse Lyu 就在这里,公司位于加利福尼亚州圣莫尼卡。

Jesse,你好吗?见到你很高兴。你是否预料到你的设备会引发这种反应?你是否认为它会成为最热门的产品,除了 LG 首款无线透明的 OLED 电视外?很多人对这款透明电视也感到兴奋,我甚至不知道透明电视有什么用途。如果它靠在墙上,我们能看到墙后面吗?对我来说这毫无意义。那么,这是什么感觉?你是否预料到这种情况?

Jesse Lyu: 一点也没有。说实话,我们对观众非常谨慎,也对你坦诚以待,我们预计第一天可能会销售 500 台,早期市场采用者可能会有 3000 台,这可能就是全部了。但我们确实准备好了,如果需要的话,可以加大订单。

我们也有备选计划,但我是团队中最保守的一个。我们的市场团队和设计团队可能比我们更有信心,但对我来说,我非常保守。

有一件事我必须提到的是,我喜欢这个产品。第一个原型实际上是一个带屏幕的 Raspberry Pi。因为我们是一个非常小众的团队,我们去年早些时候推出了一个 Web 版本,供一小部分用户测试 LLM 的一个功能,即提前播放 Spotify ,结果很好。

我喜欢这个产品,因为我大约 4 个月前拥有了第一个原型,它的外观和手机差不多。大约 8 个月前拥有了预制的手工原型。我一直在捣鼓它。另一方面,我有点担心,也许我们只是一群极客,这只是我们自己的小玩意儿。

Jason Calacanis: 为自己制造能带来快乐的东西,至少你知道你有一个客户,就是你自己,然后你只需要弄清楚是否还有其他客户。

让我们从这个疯狂的价格开始,这个设备售价 200 美元。我看了一下,没有订阅费用。如果你想在里面插入 LTE 卡,你需要有一个数据订阅,

如果你想加入 5G,那就是你的事情了,只需购买 Google 的数据卡,大概每个月 20~30 美元,它们相当便宜。如果这个设备只卖 200 美元,硬件又如此精美,你如何打算从中盈利呢?我在想,你如何将这个做成一项业务?

Jesse Lyu: 我想从商业角度来看,这是最常被问到的问题之一。

首先,我可以告诉你,Jason,我们非常努力地在设计和硬件成本之间寻找完美的平衡,尽管我不能告诉你一个非常确切的硬件成本数字,因为我不允许分享,但我们确实从硬件上make money.

根据我观察到的和我在过去职业中学到的,硬件的毛利润非常低。如果你看手机,毛利润可能在 -25%~7% 或 8% 之间,仅此而已。尽管如此,大多数人仍然试图通过硬件来赚钱,显然是订阅。

与 eSIM 相比,选择制作相同的托盘有两个原因,一是我们希望进一步削减设备的硬件成本,因为 eSIM 需要更昂贵的部件,而相同的托盘则不需要,但更重要的是,我们希望将产品销售到多个目的地,而不是像在美国。

我们需要与运营商进行谈判,比如 Verizon、T-Mobile 或 ATT 等。我们进展得太快,没有时间坐下来与这些公司一年时间的谈判,而现在他们主动联系我们,这非常好,所以这都是战略性的决策。

首先,我想纠正一点。实际上看了你上一集关于我们的节目,我们没有制造任何 LLM 。我们使用的是神经符号模型,它不是一个 LLM ,通常我们说的是 GPT、Bard、Grok 等,这些都是基于 Transformer 的,它们需要大量的云端 GPU 来进行训练并获得正确的结果。

没有哪家初创公司能够突然间制作自己的 LLM ,就算筹集到 3000 万美元的资金也不行,所以就记录而言,我们没有这样做。我们与所有最好的语言模型和小型语言模型合作。如果有开源语言模型,将来我们也会考虑。

基本上,我们建立了一个内部评估系统,以持续监测所有主要供应商的性能,可以灵活切换,这就是 RabbitOS 的工作原理,但我们专注于 LAM (Large Action Model)。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

我们确切知道,语言模型或 Transformer 是为更好地理解语言而设计的,但至少目前在完成任务方面表现非常糟糕,而且我们不喜欢与 API 一起工作,因为 API 有很多问题。

首先,你要赌所有人都会为你提供 API ,事实并非如此。对于 OpenAI 来说,鼓励或大公司鼓励所有人为他们构建 API 更容易,但对于初创公司来说,很难说服突然间有 2000 个供应商在你的 API 中按照你的格式工作。

即使你拥有所有的 API ,往往它们也不能完全复制 App 的全部功能。比如,我的上一家公司 Raven(渡鸦科技)工作时曾与 Uber 的 API 合作过,他们的 API 只能完成 10 项任务中的 3 项,要说服他们做出 App 的全部功能非常困难,因为他们没有激励,所以我们不喜欢 API 。

这就是为什么我们想要一种通用解决方案,也为通用解决方案创建了一个 AI 。无论是 Android App 、iOS App 、Windows App ,无论是什么 App ,我们都要构建一个通用解决方案,知道语言模型并不是为触发动作而设计的。

因此,我们实际上使用了神经符号(Neuro-symbolic)来开始。我们实际上开始与数据标注公司合作。根据我们自己的评估,我们开始收集真正的人与不同种类的软件进行互动,比如 Uber 、 Spotify 等常见的 App 。

我们大约在两年半前开始了这个过程。开始收集真正的人与各种软件互动的数据,然后我们建立了一个神经符号算法,它就是今天的 LAM ,你可以将所有这些剪辑放入 LAM 中,并要求我们的模型逐帧读取这些剪辑。

Jason Calacanis: 随着时间的推移, LAM 了解了页面上的像素,它知道这是一个 App ,知道我在 App 中点击了什么地方,所以当有人对 Rabbit 说:「给我订一辆 Uber 豪华车。当我回家时,我希望有五个家庭份量的寿司准备好,包括一些卷和一些素食选项。」它会知道如何做到这一点,因为你已经训练了它很多次,观看了成百上千次在一个 App 中的互动。你需要多少互动次数?我是否正确描述了你正在做的事情?

Jesse Lyu: 你描述得很正确。首先,我们不会记录用户的操作。我们有一个测试小组,我们为他们分配任务。我们实际上与数据标注合作伙伴一起工作,以确保所有的剪辑都是有目的地收集的,而不会侵犯任何人的隐私。

我们从来不会设置东西来记录用户的屏幕。但是,你的理解是正确的。我们实际上已经在 Rabbit 研究上发布了整篇论文,其中包含幕后的内容。你可以去那里看一看那篇论文。

我们从真正的人类与这些 App 互动中收集了数据。事实是,这是非常具有讽刺意味的,因为神经符号在 CPU 上运行效果比 GPU 好,所以与 OpenAI 或任何 LLM 相比,我们的云部署非常合理,我们不会谈论数以百万计的现金,甚至不会谈论数百万美元。

我们有足够好的 GPU 集群和足够好的 CPU 云计算。我们不是按请求收集数据。只是要求人们随意玩耍,比如我们收集数据的方式。所以部署的任务可能是:「你有 10 分钟的时间在 Spotify 上,尽情尝试,做尽可能多的事情。我不会告诉你必须播放这首歌,点击这里,做那个,你可以自由探索 10 分钟。」

神经符号算法是传统 RPA 的最大不同之处。如果你熟悉 RPA,它基本上是在记录屏幕操作,当然了,但然后部署一个预先编程的顺序来导航你的鼠标、光标到 x、y 坐标位置,基于绝对坐标。

Jason Calacanis: 你是说 RPA?

Jesse Lyu: 没错。

Jason Calacanis: 当你编程一个机器人时,你实际上可以拿起机器人手臂,然后将它移动到拾取东西,放入这个盒子中,然后再拾取不同的物体,放入盒子 B 中,它记录了这个,学到了这个,然后可以一遍又一遍地执行这个操作。你实际上完成了这个任务,这几乎就像是向猴子展示如何剥香蕉,然后它按照你的方式剥香蕉。猴子看,猴子学,基本上是这样?

Jesse Lyu: 那就是 RPA,但是神经符号将其推进了一步,因为我们不是通过屏幕的绝对坐标来识别所有这些元素,而是从符号方法直接提取和自动标记一些元素,并进行推理。这意味着如果一个 App 彻底改变了 UI,也没有关系。

Jason Calacanis: 明白了。所以当 Spotify 重新设计它的 App ,将播客从标签中移出,然后将标签放在顶部,或者放在汉堡下拉菜单中,它仍然知道那是「播客」这个词,以及在 Spotify 中找到播客的地方。

Jesse Lyu: 完全正确。因为基本的逻辑是,这些现代软件都是为人类眼睛处理信息而设计的,它们必须有一些设置,它们必须有一些符号和文本,还有搜索栏之类的东西。

与仅仅在 GPT-4 之上构建硬件相比,这对我们来说是一个优势。首先,我想澄清一点,我们不制作任何 LLM,我们与 LLM 合作,但我们还创建了 LAM ,这是一种神经符号方法。

当我告诉 Rabbit :「为我订购一份寿司,五口之家,这么多食物,等等。」它知道如何使用 Uber Eats App 或 Doordash App 。现在, Rabbit 设备然后向云端的某个地方发送这个请求。

Jason Calacanis: 这个请求我已经通过一个 Web 界面进行了身份验证,我已经验证了我的 Uber Eats、Doordash 账户。它知道我喜欢的寿司餐厅,然后开始了订餐过程。然后我想,它回到我这里,说:「只是想确认一下,这是你要的吗?」我说是的。然后它会做什么?它弹出一个云端的仿真器,然后你有一个具有我的登录身份验证的 Web 仿真器,这是如何工作的?

Jesse Lyu: 首先,让我们从认证开始。因为如果你考虑这个设备,它与以前的一代设备的工作方式完全不同,因为它没有预先安装任何软件。它没有预先安装任何东西。它只是一个 AI,你可以选择启用什么样的服务。你可以选择这个设备有多复杂,有多高级。

如果你只说:「这是一个看起来很酷的 iPod ,我只想用它来听音乐。」然后你解锁音乐功能,选择任何供应商,它只会播放音乐。

但是明天,如果你想开始点餐,你必须解锁那个功能,登录过程你的理解是正确的,我们有一个 Web 门户,有点像我们自己的迷你版本的 IQ/icloud,如果你理解的话,它有助于所有的身份验证设置和功能管理。

你去网站上,你基本上选择你想要解锁的任何服务,因为再说一遍,对于 LAM 来说, Spotify 、YouTube Music、Apple Music 都没有区别,它们都是接口。事实上,Expedia 和 YouTube Music 甚至没有区别,它们都是接口。

我们给你自由选择你想要解锁的首选服务,你去那里,然后你点击「连接到 Spotify 」按钮,然后接下来会将你重定向到 Spotify 登录界面,我们不保存你的凭证,我们不触碰它们。

你点开 Spotify、 Uber 或者 Doordash,通过它们登录,然后我们会识别出这个账户已经与 RabbitOS 连接了,然后发生的是,在我们的云端,有一个非常创新的结构。

我们有一台超级计算机,当 Jason 与他的 Rabbit 谈论从 Doordash 订购汉堡时,发生的事情是,首先我们会看到 Jason 是否登录到了 Doordash 或 Uber Eats,然后我们看到 Jason 选择了 Doordash,接着在那台超级计算机上 LAM 与 Doordash 的 App 或网站进行虚拟互动,你看不到这一切,因为突然之间这一切都完成了,因为这是 AI。

然后,我们将重新渲染 Rabbit 的主题界面,为你提供结果,你也不是直接与主机互动,你只是与它对话,意图传递给 LLM。

Jason Calacanis: 你想做这个,然后 LAM 在虚拟环境中执行,然后重新渲染结果到你的设备上。这就是它的工作原理。你是否需要得到 Spotify 的许可才能这样做,或者你一旦在数据上训练了它,就可以做到这一点?我是说,获得许可是不错的,但听起来你可以不需要。

Jesse Lyu: 是的。当然,得到这些人的许可是不错的,或者我不应该说许可,我们应该开发一种更好的商业模式。对我来说,这有点像是早期,乔布斯给索尼打电话,说:如果从明天开始,因为我们有了这个设备,每首歌要 9 美分,我觉得这有点像是类似的情况。

首先,我们不是在创建新用户,我们不是在创建垃圾用户,不是在创建预付用户 UIU,你是 Jason,在你的身份验证下使用他们的接口来使用他们的服务,就像你在手机或电视上使用一样。

我们花了很多时间来研究条款和协议,并试图理解。对我们来说,除非他们关闭他们的接口,这是不可能发生的,因为我们没有违反任何规定,甚至没有创建虚假用户花费。有很多浪费。

我不知道你是否看到了 Sunbird 的短信绕过 Android,有很多奇怪的方法可以设置它,但我们没有设置任何这些。

Jason Calacanis: 这很有道理,因为对于他们来说,这只是他们的用户通过基本上是声音界面的方式与他们的 App 进行交互,并在屏幕上进行一些确认。

在你发布的 1.0 版本或者你发布的 0.1 版本的阶段,这个互动是如何工作的?如果餐馆要花两个小时才能送货,或者他们停止送货。

Jesse Lyu: 这是一个很好的问题,这是我们正在努力解决的一个新问题,有一部分我们确切地知道,如果是直接操作,就会直接触发服务,如果你想听「幸运」,那就是了,播放「幸运」。

如果你想要立刻到那里,那很容易,但我们还发现了一些情况。我没有在我的主题演讲中展示的一些原因,我通过 Expedia 为整个旅行计划预订了一些内部的东西或一些与我想象的,与我想象的相当相关的东西。我们基本上想为你创建一个方式,让你一遍又一遍地检查。

确切是这样。你们每个人都有这个意思,我自己也有这个意思。所以,我们需要分开类别。有一些情况下,你想让 Uber 送你回家,那就是简单的。

如果在未来有更复杂的文本,你应该能够在你的 Rabbit Hole Web 门户上看到一份关于实际文件的副本,这就是我们想要设计的方式。你总是可以得到一个门户来检查,更合法的东西,备份和你的笔记,你的会议摘要,所有这些东西都会同步到白色门户上,这就是为什么我把它更像是我们的迷你版本的云,它实际上很小。

Jason Calacanis: 它是完全半部 iPhone ,与 iPhone 15 的厚度相同。

Jesse Lyu: 因为我有一个非常小的手,很多人都误解了实际大小。我们实际上在辩论是否应该取消屏幕,因为对我们来说,这是一个缺点。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

Jason Calacanis: iPod Shuffle 是一款非常小的产品。所以它只是变成了一个小的录音机,或者无论你可以将它制作成手表,你可以将它制作成任何数量的东西。确切地说,带我参观一下形式工厂,你用一个真的很棒的设计公司为你设计了这个,也许你可以谈谈你是如何使用它来设计它的,以及设备背后的灵感,因为它看起来既现代又复古。

Jesse Lyu: 这是标志性的。我不确定是否有信心说它已经成为标志性的,但我看到很多人为我们制作了机箱和其他东西的框架。这是一个很好的开始,至少这是我和 Teenage Engineering 之间的一个很棒的故事,我尊敬他们,他们是我的英雄公司。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

大约 15 年前,我开始了与复古合成器有关的工作。当他们推出便携式合成器 OP1 时,我立刻买了下来,但制作成本非常昂贵,一开始花了几个月时间筹集资金。

首先, Teenage Engineering 不是一家设计公司,不是一个积极寻求合作并收取设计费用的公司,他们是一个非常专注于音乐技术消费品的公司,已经存在了将近 十几二十年了,非常了不起的团队。

我告诉我的团队,当我还在 Raven 的时候,如果这些家伙给我一个机会,让我去为他们工作,我会去的。时间回到 2017 年,当我正在进行 Raven 硬件项目时,我突然意识到,也许我可以说服他们与我合作,而不是我为他们工作,因为我想挑选最好的。

在我心目中,他们是最好的,所以我就写了封电子邮件,联系了他们,三天后,我就坐在斯德哥尔摩的他们办公室里,然后 Yasper 是 Teenage Engineering 的 CEO 和 Co-founder。

我们都拿出了一个笔记本和一支铅笔,然后开始画东西。在这个过程中,他问我关于,你最喜欢的艺术家是谁?你最喜欢的汽车设计是什么,还有一些 Web Chat 的问题,令我惊讶的是,我们几乎在一切事情上都有完全相同的口味,就像他问我的所有问题,他向我展示了他的黑胶唱片收藏,我向他展示了我的黑胶唱片收藏,完全一样,而且顺序也相同,他说,我喜欢这个,我喜欢那个。

我们谈论了一些事情,然后一拍即合。整个过程就像魔术一样,我想我从来没有在任何媒体或社交网络上谈论过这个,但我们实际上建立了一个秘密的 Instagram 账号。

我们没有电子邮件通信,没有电话,什么都没有。我们只是开始在 Instagram 上发布草图和视觉效果。然后,我们就像互相点赞,互相留言。就是这样,所以我们做到了。

Jason Calacanis: 这是一个公开的账号还是私人账号?

Jesse Lyu: 是一个私人账号,公开的评论。

Jason Calacanis: 这是一个有趣的方式。

Jesse Lyu: 因为时间太长了,也许以后我可以分享一些早期的作品。但我想说的是,这是两组直觉性很强的人,我们互相认识,然后有很强的协同作用。

2018 年,我正式成为他们董事会的董事,然后我对公司有了更好的了解,我明白他们需要非常专注于他们当前的路线图,他们有很多事情要完成。但我开始看到对他们工业设计的更广泛的认可,过去的 3、4 年里,我非常高兴。

Teenage 也是一家叫做 Nothing 的公司的共同创始设计合作伙伴,我不知道你听说过一家叫做 Nothing 的公司吗?他们制造手机 —— Nothing Phone。

我们也是 Nothing 的 Co-founder ,就像整个 Teenage 一样,我们帮助 Nothing 建立了最初的整个设计语言和一切,然后当我们开始做 R1 的时候,情况正好相反,我们想要创造一些酷炫的东西。当然,我们要看的第一件事是谁在那里,我们看到了一些强大的竞争对手,比如 Humane、AI-Pin、ex Apple 的人,对团队表示极大的尊重。

我告诉自己,我有点说服自己,你正在提供一种全新一代的交互软件。对我来说,提供一种没有人知道如何使用的科幻小工具实在是太冒险了。

在我的理论中,硬件从来不是首选的选择。你不是因为想制造一个炫酷的硬件而制造硬件。大多数情况下,如果你这样做,它会彻底失败。我学到了很多好的案例,我也经历了很多好的案例,你有一个很好的软件,你想要专门的硬件来让它变得更好,它总是围绕着软件,总是围绕着内部的东西。

如果你有一个非常前卫、非常新颖的软件,你想在硬件上降低风险,至少在第一代的时候是这样。对我来说, R1 是通过必要性选择硬件的结果,而不是通过偏好选择硬件。

如果我想做硬件,我可能想做很多其他的机型,就像你说的,怎么样一个花哨的玻璃?怎么样什么什么的?我们首先意识到的第一件事是,我们想建立一个良好的位置,以便我们可以与所有这些大公司和即将推出的竞争对手竞争。同时,我们也想提供一些可以与你的文化、回忆和现有工作流程产生共鸣的东西,你不需要菜单来理解如何使用它。

Jesse Lyu: 首先,对于任何单个直接操作,我现在更倾向于使用 Rabbit 。为什么呢?因为当我开始尝试完成任务时,它的速度就像思维的速度一样,我已经具备了这种速度。而且我觉得这几乎比找到那个模拟按钮还要快、更直观,甚至可以不看它,直接说话,而且 AI 的准确性足够好,执行速度也足够快。

我来给你一些快速参考。我总是在多个屏幕上,每天工作时都会同时处理很多事情,也许还要和其他人交流,如果我有什么我不知道的东西,这肯定更快。忘了闹钟,就说搜索方面,这绝对更快。然后我不得不设置一个新的标签页或者去 Chrome 开始输入。

Jason Calacanis: 你有操作按钮,有点像无线电,你按下按钮,然后定义这个词,我不需要思考,差不多 6 或 7 个步骤。

Jesse Lyu: 甚至不用那么多,一些非常高级的数字,让你快得多,我给你一个实际的例子。我正在和我们现有的一位投资人之一开会,他们会问一些关于销售和其他公司的一些数字的性能比较。

我一般不知道,我不知道去年一个公司的收入是多少。如果你考虑一下,我在 Google 上搜索,有 200 个标签页,哪一个是准确的?哪一个是正确的?这就是为什么我们设置了战略合作伙伴活动,只是为了增强这一部分,这就是单单搜索。

另一件事是音乐。我可以告诉你,你会喜欢这个的,因为它可以播放音乐,这是第二代经典 iPad,具有相同级别甚至更简单的控制。我昨天实际上有幸与 Tony Fadell 通了电话,我们通话了三个多小时,光是播放音乐,这在过去的八个月里肯定是我的首选。除了搜索,可能有 70% 的时间都在听音乐。

很多人仍然不明白。我开始在 Twitter 上发布一些东西,有一个场景我使用了视觉功能,基本上我双击相机旋转并指向你想指向的任何东西。我使用视觉来查看一个 Discord,因为 Rabbit 。过去的三天,我们已经有了 5000 名会员,而我是那里的客服人员。

Jason Calacanis: 作为创始人来听客户支持热线,那里才是离用户最近的地方。

Jesse Lyu: 我尽量回复尽可能多的信息,但我开始迷失了,因为信息太多了。我实际上在与其他人的视频通话中,然后我简单地指向相机,说,这里的人在谈论什么?很多人不明白怎么用,很多人认为,你有眼睛,你不是盲人,这太愚蠢了,你为什么要这么做?

实际上我正在做其他事情,没有时间滚动鼠标查看 50 页的内容,即使当前版本的视觉 GPT 和我们自己的视觉模型需要更快,实际上在发布之前需要更快,我正在推动它,经过 4~5 秒钟,它会说,这是一个结论。人们正在讨论 Rabbit R1 如何可能浪费工作,它给我提供了报告。

Jason Calacanis: 通常情况下,你可能会有一个受过大学教育的人,你会告诉他总结每天客户支持线上发生了什么?或者你可能会指着它,让 LLM 去做报告,这里你只需迅速拍个照片。

我也遇到这个问题。这个周末我在滑雪,一直试图用 Siri 来更改我的音乐,只是降低音量或更改曲目或播放不同的播放列表都非常痛苦,你说的是成功需要 5~10 秒, Siri 弄错了,然后你必须重新操作,然后你的音乐会被切断。

你说你按下这个按钮,然后很快地现在的响应时间,所有这些智能音响系统,你提到了几次 Raven,你曾经卖给了百度,那是你的第一家公司,我想,或第二个公司。你一定学到了很多关于声音命令的响应时间,等待那 4~5 秒钟等它醒来并理解你在做什么是多么可怕。这是你正试图解决的问题,就是前 5 秒,你如何解决这个问题?

Jesse Lyu: 如果分解一下,延迟来自两个部分。LAM 很快。如果你去查看我在 Twitter 上发布的演示,就会发现它很快。播放一首歌是瞬间完成的。

如果你问一些随机的通用问题,我们有一项技术,基本上是通过 LAM 来制作流式令牌,使它非常快速。如果你问橙子和橘子之间有什么区别?任何不需要最新信息的事情,500 毫秒以内,如果你尝试在刚开始使用 OpenAI ,那么任何搜索最新信息都会开始变慢。

我最近没有尝试过,我觉得最近又有所改进,但通常情况下,我们谈论的是与 500 毫秒相比,2~3 秒的时间。但视觉部分是延迟最大的地方。

我们谈论的是大约 8~10 秒左右,但这不是我们的问题。这实际上是目前行业中最快的速度,我们正在不懈努力地寻找进一步缩短时间的方法。

现在延迟的主要原因真的只是搜索最新信息,仅此而已。如果你只是触发 LAM 的东西,那就很快。

让我告诉你一些挫折。首先,我不想携带两个设备,没有人想携带两个设备。我不是要说服人们这只是性感,所以也许你想携带。

目前我们所能做的是,我们知道它不能成为一个 App 。与你的 iPhone 相同的足迹。它实际上非常轻,只有 110g 那么 110g 是什么感觉?从你的冰箱,拿两块没煮过的排骨,就是这样,它足够轻,以至于每次我放进口袋里,都会忘记它。

我感谢自己设计的模拟按键,因为我不需要真的把它拿出来看屏幕,我伸手到口袋里,觉得那个按钮。那实际上是我大多数时间使用它的方式,只需连接我的 Airpods 或其他蓝牙设备或汽车系统,我真的不需要看它。

我伸手去摸,但还有很多事情我宁愿去手机上查看,至少目前是这样。首先是重要的社交功能。至少在这一代中,这并不是为了连接所有你的朋友,闲聊并了解发生了什么,这更注重于解决任务。不幸的是,这部分我必须回到手机上,另一部分是专业的群聊。

Jason Calacanis: 如果你想加入 Signal、WhatsApp 或其他通讯工具的群聊,它还不能完全替代。

Jesse Lyu: 我们可以,它有个托盘,有 SIM 卡,它是一部手机。我们不是在努力成为一部手机,但它有能力做到手机所有功能。另一件事是,也许这只是事实,手机实际上是一个内容消费设备,如果你想一下 AppStore 上增长最快的 App ,那就是 TikTok、Netflix、 Instagram 等等。

iPhone 有一个更好的屏幕,我不得不承认这一点。这就是为什么,当我开始考虑激光投影仪时,我不确定,因为我看到了 Humane 的演示,手势发送消息,我可能不会这样做。

当我 2013 年开始 Raven 时,我实际上是与 Sri 几个人合作的,似乎是斯坦福大学,后来成立了 Nuance,Nuance 孵化了 Siri,所以有一个很长的历史,但我记得非常清楚的是,当我第一次拜访 Siri 时,口授大约在 74% 左右,以本土英语为基础,这是非常糟糕的,但它很快就上升了。

另一个问题是意图理解。我们正在谈论的是 Transformer 之前的时代,然后在 Raven 时,我们非常努力地开展自然语言处理或 NLP 工作,那是 Transformer 之前的最佳技术。我猜想问题不是因为我们没有考虑我们可以设计算法的方式,只是当时我们没有足够强大的计算能力,比如 GPU 可以运行它,所以如果你说意图识别,它真的很痛苦,非常消耗人力,因为本质上 Alex 以及以前的每一代智能音箱,就好像你正在为这个所谓的 AI 组装一个菜单,然后你基本上是在硬编码,这是 70 种与扬声器交流的方式,这意味着你想听这首曲目,有一堆句子可以描述相同的意图,NLP 是帮助我们理解和组装这个菜单的方式,很多事情都不太理想。

我完全理解对 R1 的怀疑,这是一个语音优先的设备,因为我们都是同一代消费者,仍然患有从早期非常糟糕体验的 PTSD。

Jason Calacanis: 确切地说,这正是 Siri 让人们感到沮丧的地方,Alexa 更好一些,但在手机上的应用程度没有 Google 那么高, assistant 从来没有真正流行起来,我们只是假定它不好。

事实上,现在情况好多了,即使是使用 ChatGPT 的 App 也是如此。我现在用 iPhone 15,它有一个动作按钮,类似于你在 Rabbit 上所做的,我把它连接到了 ChatGPT 的语音界面,当我按下它时,它在 App 中进入了那个对话模式,这非常好。

在美国,它会迅速运行,你什么时候会知道你已经制作出一个可以挑战口袋中的手机的产品?你会赢得回家拿哪个设备的比赛,如果你忘记了你的手机,你会回去拿它。如果你忘记了你的wallet,你不会回去拿,你会说,我忘记了我的wallet。我的电话上有一些支付选项,如果你没有它,你得回去拿,当你达到这个里程碑时,我必须掉头回去拿我的 Rabbit。

Jesse Lyu: 首先,挑战是一项雄心勃勃的任务。我们从来没有自己设定,至少在心态上,我们从来没有自己设定,就像 Rabbit 的整个目的是要杀死 iPhone 一样。

不管它是什么。另一方面,我们深刻理解,特别是由于我的经验,我的公司被卖给了百度,我们有一个非常独特的工作关系,仍然保持着 Raven,但我已经看到足够多了,不仅是百度,还有微软,所有其他公司,大公司是如何运作的。

我们目前的看法是,我们不认为我们有信心挑战它,但我们也不想等待。就像你可以成为用户,我在 Twitter 上发布了产品,成为弄潮儿、旁观者,还是陪跑者?你只能成为这三种的一种。

我们不是说有多少雄心勃勃,或者妄想,我有一个非常明确的总体计划,这不是创业公司的性质。我有很强的信心的一件事情是,对于所有这些基于 App 的操作系统的当前一代,要想改进是不可能的,因为技术不是,根本操作系统的转变,它永远不会是一种改进,它总是重新运作,它总是相关的。

问题不在于技术。很多工程师在工程师的角度上有不同的看法,他们认为只是这样做 Siri 就变成了 R1 ,那里就成了 RabbitOS。

不是这样的,问题是他们赚钱的动机背后,他们建立了一个拥有数十亿开发者和数十亿 App 的整个 AppStore,突然间没有 App 了,这怎么可能?

我看不到一个非常顺利的过渡,它怎么能够如此迅速地改变?我们认为应该等一等,进一步降低风险。我认为,考虑到 R1 是 iPod ,对于我们正在讨论的一定数量的请求来说,它是比 iPod 稍微宽泛的要求,因为 iPod 确实只是为了取代 Walkman,但在 iPod 时代,你仍然用黑莓电话,我用黑莓 8900,我有我的 iPod,你有两个裤袋。

Jason Calacanis: 每个裤袋放一个。

Jesse Lyu: 完全正确。它有点像固定形状,如果你穿牛仔裤,你甚至不想摸它,你只是放在那里。但我们有 R1,这是我们对未来结构的第一次尝试或方法,未来软件将如何与人类一起工作?你如何与软件互动?也许在一年半到两年内,我们会有一个更好的答案。

Jason Calacanis: 现在,你要去找那些早期采用者,想要尝试它的人,想要投入时间并给你非常好的想法的人。有没有 App 开发者直接来找过你,只是想直接为你的 LAM 制作东西,提供接口, Uber 的工程师和你的工程师可以在同一个空间中无缝运行,实际情况是这样么?

Jesse Lyu: 实际上这是双方的。一方面,我们在 Twitter 上通过握手方式进行了交流,没有预先沟通,现在我们为前 10 万台设备提供 200 美元的 Credit。如果你考虑设备本身,价格只有 99 美元。更重要的是, RabbitOS 最被低估的特性,目前还处于实验阶段,但我们有信心很快在用户收到设备后推出至少是 beta 的版本,这就是教学模式(Teach Mode)。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

教学模式如何工作?实际上你之前解释到了,就像猴子对猴子,你去这个网页门户, Rabbit Hole,打开教学模式,你决定今天我要教你点什么,就像你在教你 8 岁的孩子一样,你会说,来找爸爸,坐在这儿,看我在做什么,学吧。

如果你考虑神经符号学,同样的比喻,背后有一个心理因素,如果我让你教我滑板,你是否愿意?有两个决定,一个是你是否愿意做;第二,即使你想做,你可能也不愿意做。但更重要的是,如果你根本不知道如何做,你只会说不。对吧?所以你作为用户去教学模式,你确切地知道你要教什么。

Jason Calacanis: 对吧?如果你从来没有滑过滑板或滑雪,你是不会去教滑板如何使用的。但如果你说,嘿,我该怎么滑雪呢?如果我选择这样做,这将是很好的训练数据,这就是你的想法。如果有一个 App 人们没使用,就像你还没有训练 Twitter ,我可以说,让我训练 Twitter ,去记录我的回复,我提及的内容,我喜欢读的内容,然后请马上大声告诉我其中 5 条内容,但不需要你朗读日期,只是想让你读内容,只需读前 200 个字,而不是整个内容。

Jesse Lyu: 完全正确。你已经在使用这个功能了,这就是它的强大之处。教的时候,你知道你在做什么,你收集的数据,我们不会记录在你的本地设备上。我们启动虚拟机,这是一种旧技术,你进入虚拟机,选择你想要教的平台,然后开始教,这个录音非常干净,RabbitOS 可以获得一次性的机会。

Jason Calacanis: 所以你让整个Community来教 RabbitOS。

Jesse Lyu: 构建你自己的 Rabbit,这就是我们赚钱的方式,顺便说一句。

Jason Calacanis: 明白了。我可以制作一个 Rabbit ,那将是我解释 TikTok 或社交媒体 App 的方式,就像我们谈到的那样,然后我可以出售这些,我可以卖给其他用户我的 Rabbit。

Jesse Lyu: 我们不是在重新发明任何商业模式,这是经典的 App , Apple 的 AppStore 或 Google Play 商店获得的逻辑,但我们不担心从现在开始赚钱。

Jason Calacanis: 像这样制作硬件设备,构建这些东西,你需要多大的团队?我们看到很多人用更少的资源做更多的事情,我很好奇。

Jesse Lyu: 迄今为止,我们有大约 17 个全职员工,但我们正在招聘,但我也与优秀的 ODM 以及 OEM 合作。在过去 Raven 职业生涯中,我有资源,这是同一个团队加上,设计部门和十几岁的孩子帮了我们很多忙,但我们正在招聘,正在努力制作 LAM 的未来版本。

考虑一下,这是 LAM1,我们正在设计 LAM2,明年将会更加有趣,具有不同的手机特征。总体想法是,我从我以前的公司中学到了,如果你的目标是在第一天就赚钱,你可能根本不会成为一个消费者硬件公司,你会变成一个…..怎么说呢? 更像是 Oracle。

Jason CaXiaobai Navigationlacanis: 你似乎受到了 iPod 的很大启发,如果你想想 iPod ,我不知道你是否还记得,第 2 代 Shuffle,这是我的最爱。我相信 Apple 的巅峰疯狂,它是一个夹子,几乎就像一个领带夹。

Jesse Lyu: 短一点的头,耳机线短一点,他们也没有改变,我记得它是一个环,我也有。

Jason Calacanis: 一个短的耳机线,因为他们知道你要把它放在腰部以上,你不需要把它跑到口袋里,但它也有物理控制按钮,所以从那个角度来看,它非常优雅,物理上有滚轮,这个滚轮在这上面有什么作用?

Jesse Lyu: 我们正在研究不同的想法,我不能分享太多,但我可以分享一个正在研究的想法,这是如何解锁你的设备。

Jason Calacanis: 当你在高中的时候,你的密码就像一个锁,两次左转,两次右转,那真是太聪明了。

Jesse Lyu: 带有触觉提示,而且没有人会知道的,它甚至不是一个文本或什么的。

Jason Calacanis: 太酷了。所以会有不同尺寸的,你说你实际上不需要屏幕,你需要制作自己的响应式耳机吗,还是你认为是蓝牙的?

因为我有一个问题,我有我的 Airpods 第三代,它非常优雅地工作,但我更喜欢 Pixel Buds,我不知道你是否用过 Pixel Buds,但它们是扁平的,他们是更加优雅的设备。

如果你使用滑雪头盔,如果你睡觉前想听播客或像我一样听有声读物,它们更好。那么你怎么看?因为如果它是一个独特的耳机,那么我会有硬件收益或用户界面收益吗?

Jesse Lyu: 如果你从内核的角度自定义,你可以进一步降低延迟,延迟是个问题,特别是在汽车系统中,这就是为什么所有的汽车理论都不起作用的原因,因为汽车系统的延迟是非常好的。它的蓝牙 5.0,它默认适用于任何不同的默认机场和第三方制造商。我更感兴趣的是,也许我们可以做一个 Rabbit Airpods ,但它是完全独立的。

Jason Calacanis: 这太有趣了。所以你把它们戴上,它就是你的 Rabbit 版本。我只需与它交流并进行身份验证,我只带着我的 Rabbit Airpods 出门,说给我订一辆 Uber,它说 OK,Uber Black、Uber X 或者 Uber SUV,这太酷了。

Jesse Lyu: 这些挑战来自一个方面,你在等待一个更小但更强大的芯片。如果我做一个 Airpods Max,我可以很容易地做到,我现在就可以做到,但如果你想做得对,就会有一些挑战。

Jason Calacanis: 在你的情况下,必须有 SIM 卡或 eSIM 或其他什么,电池寿命开始起作用了。有很多不同的问题,这是一个绝妙的想法。如果你有头戴式耳机,而 Rabbit 内置在其中,然后你只需要那些。有没有人曾经在耳机里放过 CPU ?我从来没有见过,那将是令人惊叹的。

Jesse Lyu: 深圳或秋叶原肯定有一些这样的产品,我们可以去找找。理论上,我是说,深圳已经查过了,我打电话给我的朋友,确认那里有,高通以及 Apple 正在研究这个问题,我们不仅仅是在谈论。

Jason Calacanis: 他们可能会推出这个,你认为他们可能会推出吗?

Jesse Lyu: 这是每个人正在努力的方向。

Jason Calacanis: 我会戴上我的 Airpods Max,不管他们叫这些什么,那么我喊 Siri 进行播放,不需要带着手机,它有内置 Wifi 和 LTE,那将是惊人的。

Jesse Lyu: Jason,我给你看点东西,这是 R1 的实际主板, 我们甚至没有试图使它更小,因为看看手机的形状,它很合适。如果我非常努力地尝试使它更小。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

Jason Calacanis: 它是一张扑克牌的一半,如果你把黑桃剪成一半,这就是主板的大小。

Jesse Lyu: 所我们现在可能可以做到,但我想做 Airpods 版本,那会有一点挑战。另外,因为你想要将其设置为始终监听,电池也是一个问题。

Jason Calacanis: 监听需要更多的电池。

Jesse Lyu: 我对未来 48 个月非常有信心,我们可以开始研究这个问题,但另一件值得考虑的事情,我没有泄漏我说的任何东西,这只是我的思维逻辑,这是我们接下来要做的事情。

Jason Calacanis: 这不是产品路线图。

Jesse Lyu: 这不是,我们只是随口说说。手表也是一个很有意义的选择,Community成员中已经有很多人在 Twitter 上设计了 Rabbit 手表并标记了我,做得很棒,但如果你仔细想想, Apple Watch 可能是他们整个产品线中最弱的产品。

Jason Calacanis: 我必须说,直到 Ultra 出现之前, Apple Watch 都不怎么样。电池寿命更长了,屏幕尺寸更大了。当我跳入水中时,它会告诉我我在水下多深,它的电池寿命实际上能够持续 2 天,与其他产品相比,这是一个巨大的改变,屏幕比其他产品大多 25%,它的屏幕非常亮,100% 非常亮。

Jesse Lyu: 这也是一个重要因素。我的意思是,从我自己的经验来看,也许 Apple Watch 在他们整个产品线中是最弱的,因为它是一个配件,不是一个独立的设备。

Jason Calacanis: 他们确实没有将其作为一个独立的设备来关注,我同意。

Jesse Lyu: 他们说它是一个独立的设备,我明白你可以打电话,我明白有些功能,但有些地方做得不好。

Jason Calacanis: 打电话不好。

Jesse Lyu: 一些 Youtuber 用它做了一周的挑战。我看到 Youtuber 挑战了。我觉得有人真的用他们的 Apple Watch 一周,它可以工作,但它不是为这个设计的。有一个很好的机会或想法,因为我开始关注孩子和他们的设备使用方式,这是Community的一部分。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

Jason Calacanis: 在我们继续之前,我只想在现场展示一下,这是一个粉丝制作的作品,所以对于正在观看的人来说,它是标志性的橙色,非常华丽。然后它有像是冠军一样的表冠。但最棒的部分是它有一个弹出式相机,屏幕上设计有一个弹出式相机的小缺口,完全不切实际,但很棒。

Jesse Lyu: 它保留了所有关键的元素,像通风孔,通风格栅等,令人印象深刻。

Jason Calacanis: 这个社区是如何开始的?顺便说一下,因为你是不是引导了这个疯狂的工业设计社区,还是他们跟随着 Teenage Engineering ,叫什么来着?Teenage Engineering ?

Jesse Lyu: 是的。

Jason Calacanis: Teenage Engineering 鼓舞了工程学生或其他工程师,因为看到了多少人开始制作你的标志性产品的衍生品扩展。

Jesse Lyu: 确切如此。首先,我要非常感谢 Teenage Engineering 。如果你曾在设计或工业设计或音乐方面工作过一天,他们都是最高级别的。至少这是我的观点。我不在乎有人是否同意或不同意我的观点。在我心中,他们是最顶级的,这是一部分。另一部分是,Jason,手机现在太无趣了,工业设计基本上已经死亡了。

Jason Calacanis: 我可以解释一下,因为我不能告诉我的过去五代 iPhone 之间的区别,确切如此。

Jesse Lyu: 像手机公司一样,它们坚守着它们当前的乐趣因素。通常,如果我们考虑一下有趣的时光,让我们考虑一下 Sidekicks、Engage,想想那些东西,像翻转的诺基亚手机,这已经过去很久了。

如果你看看过去,尤其是过去的五年,三星和 Apple 是一个很好的例子,现在它们已经成为了经典,我看到了 iPhone ,我知道那是 iPhone ,我看到了 Galaxy,我知道那是 Galaxy 手机,但我也可以 100% 地告诉你,下一代将会看起来一样,只是颜色不同。

Jason Calacanis: 这是因为制造成本的原因。制造这些新版本非常昂贵,这就像汽车一样。一旦你为丰田普锐斯制造了一辆新版本,每次重新设计它,你都要重新启动整个生产线,而且你得不到任何规模效益,所以这是一个规模业务。你试图在竞争激烈的市场中获得巨大的利润,所以他们不改变。

Jesse Lyu: 乔布斯并没有。

Jason Calacanis: 他并不在乎,你可以肯定他并不在乎。

Jesse Lyu: 只是这种精神通常已经消失了。我们没有帮助,我们没有基本上在做这件事。这是我们所有人作为消费者的共同感觉,如果你带来了新鲜的东西,它相对便宜,我们是一家新公司,但人们通过看它来感受到快乐,然后这启发了他们创造自己的变种,这是另一轮涟漪,这个涟漪会不断扩大。

我真的很理解为什么 Kyle Pay 在一开始就创立了 Nothing,我们有几次聊天。他整个公司的立场是手机很无聊。

Jason Calacanis: 我是说 Nothing Phone 太疯狂了,你喜欢 Nothing Phone 的什么?什么激发了你?

Jesse Lyu: 他们可能是最注重工程和工业设计的公司之一,提供更好的事物。他们刚刚创立,大多数初创公司不会在这两个基本领域投入这么多资金来制造产品,我要非常感谢他们,我没有直接参与他们的管理或其他事务。

Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

但是,与 Teenage Engineering 在一起,从一开始就看到了这家公司的发展,这是一段相当艰难的旅程,它非常具有挑战性,他们的东西不便宜,你可以看出它不便宜。

Jason Calacanis: 它不便宜,是一种奢侈品,他们试图制造它,它是一种奢侈品吗?

Jesse Lyu: 嗯,它仍然比旗舰 Android 手机便宜 100 美元左右,我会这么说,但它不像深圳的东西那么便宜。如果你考虑年轻一代,比如在 2000 年后出生的所有孩子,当他们长大后,他们首次接触手机,然后在过去的五年里都是一样无聊的东西。这有多疯狂?想想当我们开始拥有手机时,我们有 200 多种不同的选择,我们之所以买手机,只是因为它很酷,就是这样。

这一部分大多已经消失了,这是因为制造业务背后的东西,但是对我们来说是好事,因为我们太小了,刚刚起步。

Jason Calacanis: 你们承担了巨大的风险,你们没有什么好失去的。

Jesse Lyu: 就是这个原因, Siri 、Google Assistant 或 Alexa 不可能如此迅速地迎头赶上。

Jason Calacanis: 我必须扔掉它。老实说,技术发展得如此之快,以至于 Siri 和 Alexa 需要被扔进垃圾桶,他们应该重新开始一个新的项目,这样实际上会更快。

Jesse Lyu: 我同意。Siri 的技术一定是惊人的。整个范式已经发生了变化,变成了 LAMs 和 LLMs,而它们并没有建立在这个基础之上。

Jason Calacanis: 我是说,它需要扔掉。如果你看看 Elon 正在做的自动驾驶,他不会害怕说,我们制造了这个软件来保持车道,但是它并不是,有新技术将会颠覆它。我们需要转向新技术。现在,硬件堆栈可能不会改变, iPhone 的硬件堆栈可能完全相同,但 Siri 必须消失。

Jesse Lyu: 我想给 Elon 非常大的赞赏,因为他的一些思考方式确实让我产生共鸣。一个例子是,如果你看看 Cybertruck 中的所有电缆,我不确定你是否订购了一辆,但它马上就要到了。

如果你看看他们如何重新设计电缆,这太疯狂了,因为所有的汽车都有,什么,像现在有大约 10 英里长的电缆,都绕在不同的支柱上。他不喜欢那样,他认为那太复杂了,这些想法真的推动了很多创新。

从我们所受益的地方来看,就像你说的,我们很小,我们承担风险,但这是我们想要思考事情的方式,我们不是说,也许我们再等两年吧,还有更多的 API 可以使用,也许我们可以穿上西装,走进 4 个 App 的办公室,与他们的高管谈话。也许我们可以达成交易。

我们的想法是我们不再使用 API ,我们不再使用 App ,我们只是从头开始做一些事情,我们从中获益匪浅。

Jason Calacanis: Cybertruck 采用了 48 伏特的系统,这降低了汽车中的总电缆长度,减少了 80%。现在我猜唯一的缺点是,如果你丢了那根电缆,汽车就完了,失去了很多,但好处是,如果出现问题,更容易诊断,你只需更换电缆。

Jesse Lyu: 很难丢失这根电缆,因为你有防弹板。

Jason Calacanis: 确切如此。我是说,Joe Rogen 试图用箭射它,但没有成功,而且他的射击技巧相当不错。你们很Safety,Jesse,你是一个了不起的嘉宾,我希望你在它发货时再来,你认为人们什么时候可以拿到这些设备?你最好的估计是什么?

Jesse Lyu: 我们的承诺日期是复活节,也就是 3 月 31 日,那是我们开始发货的时间,我们正在与当地的合规和法律团队合作,以尽快发货国际订单。

国际批次可能会在 6 月或 7 月,但我们正在努力加快一切,但我们可以分配大约 50~100 个媒体测试设备的数量。

Jason Calacanis: 感谢你把我包括在内,我非常兴奋。

Jesse Lyu: 你已经自己报名了。预计在 2 月中旬左右,在接下来 2~3 周内。从下周开始,我将开始发布所有在主题演讲上展示的演示,我已经在这里和那里展示了一些,但正如我所说,延迟是我们真正关注的问题。

Jason Calacanis: 你们一共研发了多少年?顺便说一下,人们不太欣赏的一点是,这不是你过去 6 年一直在做的事情,创建硬件初创公司的能力与你 10 年前开始时大不相同。

深圳的成熟度,仅举一个例子,当我第一次去深圳时,我想是在 2006 年或 2007 年,当时很少见到美国人,一个白人,所以当我去那里时,不要开玩笑,有 20 名学生围着我,想要触摸我并与我合影,因为他们从未见过,因为他们来自北方。

在深圳有一个著名的游乐园,不是为美国游客准备的,而是为中国国内的游客准备的,我去那里只是为了看看,我真的被拦住了,10 次左右,人们想要触摸我并拍照。

现在有很多美国人,有很多初创公司在那里。当我在 2007 年去那里时,我猜是 15 年前吧,更多的是,会有一幢高楼大厦,30 层楼,然后,在周围的四个街区里,都是停车场。你会从一栋建筑物开到另一栋建筑物,你可以看到你要开到的建筑物,但就像开车穿越沙漠,你知道吗?

Jesse Lyu: 我在中国出生,但我是在一个非常西式的家庭中长大的,我的父母会说,一旦你满 15 岁,你就得自己照顾自己。

我 15 岁后就开始学英语,然后他们说,一旦你独立,我真的在 15 岁的时候离开了家。我有一次获得了一个转学机会,短暂地在新加坡的一所高中上了一段时间课,然后我去了英国,我毕业于利物浦大学数学专业,然后在伦敦又待了一年半,只是和一群艺术家呆在一起,所以我现在真的不太了解中国,我已经离开这个国家很久了,但我相信你,情况已经非常不同了。

深圳的 ODM 和 OEM Infra 已经建立了几十年,至少仍然为 Apple 等公司服务,所有的 iPhone 都是在那里生产的,但很多事情开始有所变化,因为从硬件角度来看,我能看到很多事情都变得模块化了。另一方面,核心芯片正在变得集中化。

Jason Calacanis: 核心芯片正变得集中化,TSMC。

Jesse Lyu: Nvidia 正在加强这一点,或者说 arm 和其他公司正在加强这一点,但是组件,任何人都可以制造它们,然后将它们插入这些 CPU 中,任何人都可以制造它。

Jason Calacanis: 但是,深圳的速度仍然无人能及。

Jesse Lyu: 这是一个很酷的地方,他们可以为你制造全新的东西,然后在几天内将其送回到美国办公室。完全可以迭代。迭代周期以前是几个月,现在是几周。

Jason Calacanis: 现在肯定是几周,如果你有一些特殊的资源,你甚至可以在几天内完成,这是令人难以置信的。

Jesse Lyu: 是的。想想看,以前迭代周期是每季度一次。因为我曾经试图在 10 年前投资过一些硬件初创公司,迭代过程太慢了,你无法灵活应对。现在你可以在几周内完成,甚至可能在一周内完成,这真是不可思议。

Jason Calacanis: 那为什么你认为芯片的集中化对初创公司来说不太好呢?

Jesse Lyu: 因为你只会与精选的合作伙伴合作,然后他们有很多大客户需要合作,然后他们会说,如果你的销量没有超过这个数字,我们甚至不会和你谈。

Jason Calacanis: 明白了。你认为风险和开源芯片运动会在未来产生影响吗?风险对开源芯片有什么看法?

Jesse Lyu: 这更多是关于你如何设计一个系统。很多人在争论,我一直在争论,也在我的 Discord 社区中与我的社区成员争论。

很多人说,我们能不能制造本地 LLM 呢?我们能在设备上运行 x 数量的功能,而不是在云中运行吗?对我来说,我能理解出于隐私原因,那可能是唯一合理的理由。

Jason Calacanis: 为什么你愿意在本地运行呢?有多少人关心这个问题?关心的人很少。如果你将我的指令加密,然后在云中执行它们,然后删除它们,这有什么问题,或者每隔 60 天删除一次,可能需要保留一些历史记录。

Jesse Lyu: 这只是学术观点和消费者观点之间存在巨大分歧的一个方面,消费者不在乎。

Jason Calacanis: 确切如此。我提出这个案例的方式是,有一种方法,我们可以朝着 Chromebook 的方式前进,即使操作系统也在云中。如果我们选择这条路线,那么我们就不用担心芯片的问题,因为你不需要那个芯片来在本地运行大量任务。

Jason Calacanis: 它是一个终端,你把终端打开。

Jesse Lyu: 实际上,我支持这条路线,因为从消费者的角度来看,我为什么需要在我的汽车中拥有 CPU ?或者是电视机?为什么我需要那个?而且,一切都是智能的。

电视是智能的,一切都是智能的。我实际上正在设置一个小公寓,因为我变得太忙了,我不再呆在办公室。我正在设置电视,然后我需要从我的电脑上进行 Airplay 操作,所以我去了商店,买了一个 Apple TV,然后我买了一台三星的智能电视,它们都有 Netflix。

Jason Calacanis: 现在你有两个遥控器,其中一个三星遥控器上有 Netflix 标志,就像我为什么要买 Apple TV?

Jesse Lyu: 确切如此。然后三星有他们自己的 Chromecast 或其他什么,应该是这样。如果你想想背后发生的事情,我们需要所有那些吗?我们是否真的需要在电视上安装高通芯片,如果你的电视可以投影东西,那就是电视应该做的事情,所以,这是一个有趣的趋势,特别是在接下来的几年里,我们将看到谁能占上风,本地公司与云公司,以及它们的工作方式。

我同意 Elon Musk 和其他一些人的观点,如果 AI 运行在这种方式下,我们将面临电力短缺的问题。

Jason Calacanis: 我们将面临家庭用电和数据中心用电的实际电力短缺问题。我们将需要更多的电,因为这些设备运行得很热。

Jesse Lyu: 是的。如果我们保持目前的速度,我们真的没有足够的晶体管和 Transformer 来处理 GPU 集群,那么很多 Infra 都需要关注。现在如果因为 H100 型号太多而出现能源危机,人们将再次对核能感兴趣。所以人们会说,我们只需要在这些数据中心旁边建一些核反应堆,并建设大规模的太阳能农场,以获得更多更便宜的能源。

Jason Calacanis: 这就是,人们一直没有太多考虑的原因,因为我们一直能够跟上,但是如果突然间我们无法解决癌症,因为我们没有足够的能源,我们没有足够的芯片来治疗癌症,我们有那个软件,我们有芯片,我们没有足够的能源来将这种定制药物治疗的重点放在某个地方。

Jesse Lyu: 对我来说,消费者离实际问题有多远,对我来说是很重要的,如果你距离问题很远,你不会关心。但是如果你在旁边,然后突然间成为一个问题。所以,就像我说的,我们不知道这是否是正确的手机因素。我们不知道,但我们知道这是我们可以承受的最低风险,我们知道 LAM 是最重要的。

Jason Calacanis: LAM 就像狙击手一样,你可以很容易地完成任务。当我们在这个行业开始时,我记得在 90 年代,有家公司叫做 General Magic,他们正在制造一个带有 Agent 的设备。你会告诉 Agent,我想飞到巴黎。

我的意思是,它会知道你在纽约,然后它会出去,尝试为你找到机票,然后去找一位旅行代理人,然后试图找到结果,然后将它们以某种格式放回来,以便你可以说,好的,我喜欢这个行程安排。现在,2000 年、2005 年、2015 年、2025 年,经过了 30 年,很有趣。

Jesse Lyu: General Magic 是 Apple 的一个内部项目, Apple 并不真正了解它,所以将其分拆出去了,他们的标志是一个带着帽子的 Rabbit。

Jason Calacanis: 对,我记得那个。Rabbit 会在小动画中伸出头。我记得索尼为 General Magic 制造了第一台实际的硬件。

Jesse Lyu: 一些早期版本的 PDA 和其他东西。

Jason Calacanis: 个人数字助理,我记得当 Palm 在纽约推出时,大约在 97、98、99 年左右,人们都有一部 StarTech 手机和一部 Palm,你拿出这两个设备,然后你学会了 Palm 脚本。

你学会了如何在触摸屏上进行脚本编写,而不是发送钱,那是 Elon 和 Peter Thiel 要做的事情,或者说 Peter Thiel 要用 Paypal 来做的事情,它是用来发送名片的,而 iPhone 15 的最新功能是通过敲击两部手机来发送名片,这太滑稽了。

Jesse Lyu: 这实际上是一个很好的观点,因为我深信,人类从来没有发明新的需求。我们有一定类别的需求,我们想休息好,我们想吃好喝好,想娱乐,想有动力,想开始工作。

技术并没有发明新的需求。技术一次又一次地解决同样的问题,但每一代都以更直观的方式来解决。这正是你说的,用 Palm 发送脚本到名片,与现在的敲击两次错误放一样,它是一样的,更加直观。

硬件非常有趣,因为如果硬件足够直观,那么手机因素会保持很长时间。你永远不会,我从来没有听说过每年有 2000 家公司声称他们能制造更好的锤子,为什么?因为它足够直观,它只需要你的力量和遵守基本规则,就是这样直观。

如果你考虑一下计算机和移动设备,还有很长,很长的路要走。这就是为什么我们决定向前迈出一小步,我们说,我明白你们对这个或那个持怀疑态度,但我们必须尝试,至少我们必须这样做。

Jason Calacanis: 有一种瞬间的特性,如果你告诉人们,我一直认为,当我寻找要投资的初创公司时,这家初创公司是否在为人们节省时间?它是否在为人们省钱?或者它是否以某种方式娱乐人们?

如果你看看你的设备,它将会为人们节省时间,而时间对于一些人来说相当于金钱。有些人比时间多,有些人比金钱多。

总的来说,你的设备是一个节省时间的设备,它会娱乐人们吗?当然,可以有娱乐服务,首先是为人们节省时间,让他们回到孩子或晚餐或其他事情上,离开他们的设备,这真是不可思议,你的意识到延迟必须改变,毫秒数要降低,人们会搜索更多。如果他们使搜索结果更快,人们会更多地使用 AI。

Jesse Lyu: 我可能可以在你有测试设备的时候得到它。

Jason Calacanis: 这将是令人惊叹的,只是点餐的能力更快。我为我的家人点的是同一种寿司卷,那种手卷。如果我能重新点那个卷子,秒杀,而且我能越快越好。当这个东西在三个月内推出时,你会再次来吗?

也许我们可以亲自见面,也许我们可以做一些。你知道吗?当你准备好推出它时,留下一些演示,比如三个,我们可以现场演示。

Jesse Lyu: 我们将创造实时,进行实时演示,为什么不呢?

Jason Calacanis: 我们将亲自进行现场演示,我会租一个剧院,我们可以坐在那里聊天,我们可以现场演示一些东西。如果你想了解更多信息,或者如果你想与 Jesse 一起工作,做疯狂的、令人敬畏的、酷酷的事情,就像乔布斯一样,人们如何了解你的职位空缺?

Jesse Lyu: 很简单。我们有一个职业页面。我们不断更新职位。但只需通过 Twitter 联系我,或者随时发送一封 Rabbit 或技术的电子邮件。只需访问我们的网站,发送电子邮件,我们的网站是 Rabbit.tech。

Jason Calacanis: Rabbit.tech,确保查看研究页面,以获取有关 LAM 如何工作的详细说明。

Jason Calacanis: 你们的关于 LAM 工作原理的页面真的很酷。

Jesse Lyu: 只需给我们发送一封电子邮件,我们会处理的。你们是在招聘什么职位?

Jason Calacanis: 你们最难招聘哪些职位?

Jesse Lyu: 基本上,我们需要在每个方面扩展大部分与产品相关的职位,因为我们正在努力赶上需求,还有很多我们正在尝试为未来构建的东西。更重要的是,我们想建立一个 LAM 研究小组,专门致力于未来的 LAM 版本。

Jason Calacanis: 你现在是亲自在办公室吗?你在圣莫尼卡亲自办公,试图让人们来办公室。

Jesse Lyu: 但如果你很优秀,就可以灵活。但是,如果你真的很优秀,让我告诉你一些,住在圣莫尼卡,有很多很棒的餐厅,这是一种令人难以置信的生活方式。搬来和 Jesse 在圣莫尼卡一起玩,这是个很棒的地方。

The article comes from the Internet:Rabbit 创始人兼 CEO 吕骋最新对谈:R1 更像是 AI + iPod,而不是 iPhone 杀手

相关推荐: 技术解析 BRC-20 钱包的潜在攻击方式

从 BRC-20 的设计原理出发,系统性分析Binance暂停 ORDI 提现的原因。 撰文:Trustless Labs 在深入研究 BRC-20 代码和机制后,我们发现转账阶段存在针对 huge holder 可能的攻击手段。为了帮助exchange检查是否存在流程规范问题,…

share to
© 版权声明

相关文章