Yupp 种子轮揽 3300 万美元,推特前技术骨干重构 AI 模型评估体系
撰文:KarenZ,Foresight News
随着 AI 技术的飞速发展,AI 模型的层出不穷和多样化让用户眼花缭乱。如何选择适合自己的 AI 模型,除传统基准测试外如何让模型精准捕捉真实需求、如何为反馈用户提供实打实的激励,成为 AI 行业亟待突破的关键命题。
Yupp 正是在这一背景下诞生的开放型平台,旨在建立一个开放、透明、社区驱动的 AI 模型评估平台。正如 Yupp 所说,「与历史上任何其他技术创新相比,AI 更依赖于每个人的参与和贡献来推动进化。」
上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 领投的 3300 万美元种子轮融资,同时谷歌首席科学家 Jeff Dean、X 联合创始人 Biz Stone 等豪华投资人阵营吸引了社区的目光。与此同时,Yupp 还推出了其产品,不仅为用户提供了一个探索 AI 的窗口,更通过社区参与和区块链技术重新定义了 AI 模型的评估与优化方式。
Yupp 团队和融资背景
Yupp 背后公司为 Ber Sarai Labs Inc.,由 Pankaj Gupta 和 Gilad Mishne 两位联合创始人于 2024 年 6 月共同创立,在过去 6 个月一直在秘密进行测试。Yupp 两位联合创始人和首席科学家于 2010 年在推特相识,均拥有深厚的 AI 行业背景,曾在 Coinbase、Google、X 等公司工作过。
-
Pankaj Gupta:Yupp 联合创始人兼 CEO,拥有印度理工学院德里分校计算机科学和工程学士学位、斯坦福大学大学计算机科学博士学位,曾在推特担任过技术主管、个性化和推荐高级经理、ML 高级职员(2009 年 3 月 -2014 年 5 月),在谷歌先后担任过工程总监和高级工程总监(2017 年 7 月 -2021 年 3 月),也曾担任过 Coinbase India 一号员工和站点负责人,之后在 Coinbase 担任过工程副总裁和顾问(2021 年 4 月 -2024 年 5 月)。
-
Gilad Mishne:Yupp 联合创始人兼 AI 主管,曾在英特尔担任过软件工程师(1998 年 -2000 年),在雅虎担任过高级科学家(2017-2010),在推特担任过高级工程师和搜索总监(2010-2015),在谷歌担任过高级工程经理和谷歌登月工厂机器学习主管(2019-2023)。
-
Jimmy Lin:Yupp 首席科学家,在麻省理工大学攻读计算机科学博士期间研究问答系统和对话界面,目前在滑铁卢大学 David R. Cheriton 计算机科学学院担任教授和 David R. Cheriton 主席。2010 年至 2012 年, Jimmy Lin 在推特参与数据分析和数据科学的基础设施建设。
本月 Yupp 官宣的 3300 万种子轮融资已于去年完成。Yupp 资本矩阵覆盖技术、投资与学术领域,除了领投方 a16z crypto 之外,谷歌首席科学家 Jeff Dean、X 联合创始人 Biz Stone、Pinterest 联合创始人 Evan Sharp、 Perplexity 首席执行官 Aravind Srinivas 、 Cred 首席执行官 Kunal Shah、斯坦福大学的四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram 和 Coinbase Ventures 亦参与其中。
Yupp 是什么?如何运作?
Yupp 定位为 AI 模型探索和评估平台,允许用户免费体验和比较各种 AI 模型,其核心理念是通过众包的方式进行模型评估:用户提交提示词,对比不同 AI 模型生成的回复,并给出较优答案和给出评定反馈,同时得到可兑现的积分激励。这些选择和反馈会被记录下来,形成用于 AI 模型后期训练和评估的数据。
Yupp 还将利用区块链等开放访问和无需许可的技术、零知识证明和挑战 / 响应机制等密码学原语和协议,以及机密计算等隐私保护技术,构建具有可证明的可信中立性、公平性和稳健性的系统。
Yupp 的运作机制可以概括为以下几点:
1、模型探索和对比:Yupp 汇集了超 500 个 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用户可以在平台聊天页面找到各种 AI 模型,并进行 Prompt 测试,直观并排比较它们的优劣。
Yupp 当前有聊天页面和排行榜两个页面,其中,聊天页面设计较为简单,有消息框、文件上传功能、模型选择功能(可选)、图片上传功能、聊天私密和公开模式切换(默认私密)。
如下图所示,提问过后,Yupp 会给出两个 AI 的回答版本,然后用户选出较优版本。
值得一提的是,提问时模型默认自动选择,有时还会隐藏掉模型名称以收集更客观的反馈,当然,用户也可以随机提问。此外,Yupp 的 QuickTake AI 功能还可以提供简短总结回复。
2、用户反馈:用户在选出较优答案后,可以进一步通过点击标签反馈答案的优劣偏好,也可以用文字自由阐述。这些反馈将帮助用户定制未来在 Yupp 上的 AI 答案,也让 Yupp 能够免费提供模型。
3、反馈奖励:给出反馈后,用户会得到一个积分刮刮卡。积分可用于提问或兑现。
4、评估:用户通过选择的最佳回复和提供的反馈,参与到模型的评估过程中。Yupp 旨在建立一个公开透明的评估体系,让 AI 开发者可以获取有价值的训练数据,用户可以获得奖励,共同推动 AI 技术的发展。Yupp 平台具有一个名为「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公开排行榜,旨在利用用户反馈来改进模型性能,同时保证用户 Prompt 的私密性,除非用户选择共享。
Yupp 会根据用户反馈以及响应速度等因素制定一个排行榜。排行榜中,可以按过滤器对平台上集成的 AI 模型进行排序,维度包括 VIBE 评分、概率样本的置信区间、投票情况、速度、延迟、输入 / 输出成本。
Yupp 的 AI 模型评估会结合用户的偏好数据,以更细粒度的方式对用户和评估数据进行细分,从而为 AI 开发者提供样本。Yupp 表示,凭借团队创始人在 Twitter 上应对垃圾信息和机器人问题的经验,开发了复杂的算法来剔除低质量数据,确保排名的完整性。Yupp 还组建了专门的信任与安全团队,并将继续在该领域投入大量资金。
Yupp 积分体系:消耗与兑现的平衡规则
Yupp 积分靠提问消耗、靠反馈赚取,并且部分可以兑现。Yupp 表示,如果用户负责任地使用 Yupp,将始终拥有足够的积分提问 AI 模型,并且还可以兑现一部分积分,以表示对改善生态系统状况的感激。
提问需要花费积分,初始注册后可免费获得 5000 积分。另外,总费用为默认费用、PRO 模型费用、附件提交费用、预选图片模型费用之和。
-
基本费用: 每个提示词默认花费 50 积分。如果生成图像,则费用为 100 Yupp 积分。
-
PRO 模型: 这些高级模型,仅在其他平台通过付费订阅提供。如果用户预先选择 PRO 模型,则每次提问需额外花费 50 个 Yupp 积分。
-
MAX 模型: 这些模型是使用最昂贵的模型。如果用户预先选择 MAX 模型,则每个模型每个提示词需额外花费 300 Yupp 积分(含基础费用共计 350 积分)。
-
附件提交费用:每个附件需要花费 25 个 Yupp 积分。
-
选择图像模型: 每个预选图像模型需额外花费 100 个 Yupp 积分。
此外,Yupp 问答默认私密,如果用户选择公开问答,仅需支付上述常规费用的一半。
如前所述,反馈模型可以赚取积分刮刮卡。笔者得到的几个积分刮刮卡在 200 到 500 积分之间。
Yupp 表示,用户可以将积分提现,换成美元、欧元、印度卢比及其他 20 多种货币,或兑换成稳定币(基于 Base 和 Solana)。Yupp 还与 Stripe、Paypal 和 Coinbase 等支付服务提供商建立了合作关系,以满足用户的不同需求。每 1000 积分可以兑换 1 美元。不过兑现功能目前不可用。为了规避女巫或滥用行为,Yupp 还设定了积分兑现规则:
-
每日提款次数最多 1 次,提款上限为 10 美元(1 万积分);
-
每周提款次数最多 3 次,总提款上限为 20 美元(2 万积分);
-
每月提款次数最多 6 次,总提款上限为 50 美元(5 万积分)。
另外,Yupp 规定,购买、出售、交易或转让 Yupp 积分等此类交易违反服务条款,均视为无效,并可能导致账户立即停用。滥用可能会导致产品功能被禁用,甚至暂停账户。
如何参与?
Yupp 参与流程如下:
-
用谷歌账号登录注册(注册获得 5000 积分,官方表示 6 月 20 日之前用「yupp-launch」code 可额外获得 2500 积分);
-
提问 AI 模型,在两个 AI 模型中选择较优答案;
-
选择反馈标签或提供文字反馈。
-
用鼠标刮积分刮刮卡领取积分。
-
自行决定是否提款(目前官方已临时关掉提款)。
小结
正如 a16z crypto 创始人和执行合伙人 Chris Dixon 表示,「Yupp 的设计将人类的判断转化为可持续的经济资源。随着新的互动替代旧的数据,数据「过期」,形成了一个自然的良性循环:更多的使用带来更新的评估;更新的评估产生更好的模型;更好的模型吸引更多的使用。所有参与者——从用户到 AI 模型构建者——都可以参与其中,并看到相同的透明规则适用于每个人,确保了一个可信的中立市场。没有人可以隐藏排行榜,也没有人可以操纵奖励或结果。」
Yupp 的口号「Every AI for everyone」,笔者认为译为「普惠 AI」更为贴切。Yupp 试图通过区块链技术与众包模式,构建 AI 时代的「评估基础设施」:让用户通过反馈获得激励,让开发者获取真实数据,最终推动 AI 技术向更普惠、更可信的方向进化。