DIGIPUNK
去投稿
发表于:10 hours ago

Yupp 推出人工评测系统,低成本访问 500 多款大语言模型

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 低成本访问500+大语言模型,含ChatGPT等付费版本
  • 🔄 积分驱动机制:新用户获5000积分,可兑换货币或继续使用
  • 📊 构建Yupp AI VIBE排行榜,通过用户反馈优化模型性能
  • 💸 获3300万美元种子轮融资,Andreessen Horowitz领投
  • 🛡️ 强制反馈机制确保数据可靠性,防止AI刷榜风险

数智朋克讯,由X平台前员工Pankaj Gupta与Gilad Mishne联合创立的AI初创公司Yupp,正式推出了一项人工评测系统,允许用户低成本访问超过500款大语言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama等付费订阅版本。用户通过输入问题,平台随机或基于提示选取两个模型生成回答,展示优劣对比选项供评判;反馈后系统随机奖励积分,新注册账户默认持有5000积分,这些积分可继续调用模型或兑换加密幣、法幣。用户也能指定最多六个模型进行横向比对,但反复提问不提供反馈将触发服务限制。

Yupp的创立源于2024年6月,当时获得Andreessen Horowitz领投的3300万美元种子资金,参与者包括Biz Stone、Jeff Dean等科技领袖。其核心目标在于聚合用户评价数据,构建Yupp AI VIBE排行榜,直观展示模型性能差异,如最快响应、最佳开源或推理能力等类别,从而帮助AI供应商优化系统。执行长Gupta强调,单个用户意见虽有限,但全球数百万反馈形成的信号能显著提升模型迭代效率。

用户参与机制设计为积分驱动,反馈质量越高积分奖励越多;提示内容默认私密,仅当用户选择才对外分享。这种模式被类比为AI界的DxOMark,但评分主体转向普通用户而非专业机构,凸显真实体验的价值。潜在挑战包括AI刷榜风险,以及与其他聚合平台的差异,但Yupp通过强制反馈机制确保数据可靠性。

本文链接: https://www.shuzhipunk.com/articles/DemZFuGmO0Q
转载请注明文章出处

文章所属标签
Yupp
大语言模型评测
AI 排行榜