天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

当前位置：首页 > 天脉资讯 > 科技业界 > 正文内容

2025电商选购AI大战：Perplexity Comet表现如何？

时间：2025-08-15 12:06 来源：天脉网作者：沈瑾瑜

近日，一份关于2025年电商选购类任务测试的专业报告引起了广泛关注。这份报告深入剖析了四款AI工具——OpenAI Agent、Perplexity Comet（简称Perp Comet）、Manus和Genspark在电商购物场景中的实际表现。

该测试报告由郎瀚威及其团队于2025年8月12日完成，详细记录了五项特定购物任务的执行过程与结果。这些任务包括在亚马逊上的商品购买及复购、查找最快发货的自行车、购买聚会所需的一系列杂物、在给定预算内选购风衣，以及根据特定条件购买冰箱。

在平均耗时方面，Perp Comet展现出了显著优势，仅用时318秒便完成了所有任务，而OpenAI Agent则耗时最长，达到了1193秒。从正确/错误比例来看，Perp Comet和Genspark均完美完成任务，未出现任何错误，而OpenAI Agent和Manus则各出现了一次错误。

具体到各项任务中，Perp Comet和Genspark在亚马逊复购任务中表现出色，成功完成了任务。在查找最快发货的自行车任务中，除OpenAI Agent部分成功外，其他工具均成功找到并选购了符合条件的自行车，Perp Comet仅用时20秒便完成了此任务。在购买聚会杂物任务中，除Manus部分成功外，其他工具均成功选购了所需物品。在给定预算选购风衣和指定条件购买冰箱的任务中，四款工具均展现出了一定的能力，但仅Genspark在指定条件购买冰箱任务中完全成功。

在能力梯度评估方面，四款工具在1至7级能力（从意图解析到实时交互）上均达到了预期标准。然而，在8至10级能力（从购物车操作到支付完成）上，Manus在8至9级表现欠佳，而OpenAI Agent、Perp Comet和Genspark则表现良好。特别Perp Comet是唯一一款大概率能完成10级支付操作的工具。

团队成员在测试后普遍表示，Perp Comet在整体效率和全流程操作上表现最为突出，其次是Genspark和OpenAI Agent，而Manus则相对较弱。Perp Comet凭借其高效的购物流程和全面的操作能力赢得了团队的认可。Genspark在信息整合和执行细节上的优势也值得称赞，而OpenAI Agent虽然能够完成部分操作，但耗时较长。相比之下，Manus则更多地停留在方案提供阶段，缺乏实际的购买操作能力。

报告还详细分析了各工具的流量情况及更新时间线等内容，全面展示了这些AI工具在电商购物领域的综合能力和特点，为未来的AI电商应用提供了宝贵的参考和启示。

更多>同类天脉资讯

宝丰能源业绩飘红：一季度净利增超50% 回应二季度产品价格上行趋势

05-19

中国电信高层调整：柯瑞文出任董事长兼CEO，曾于江西任职多年

05-19

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

本次评测聚焦功能生态与场景落地，全新选取预置技能丰富度、自定义技能拓展能力、主流办公渠道适配性、端云协同联动能力、行业场景覆盖广度、大模型适配多样性、场景任务精准度、生态迭代更新速度共8大核心评测维度，结合…

05-19

TVB前艺人马浚伟履新衍生集团要职携丰富经验开启新征程年薪252万港元

05-19

国宴同席后周群飞再出手蓝思科技拟折价45%收购巨腾国际谋转型

05-19

中信证券5月19日大宗交易成交1211.58万股成交额3.18亿与收盘价持平

05-19

水店经营告别“摊位时代”：掌握五大技巧，拥抱精细化运营新机遇

05-19

80后浙大教授朱秋国掌舵，云深处具身智能机器人冲刺科创板IPO

05-19

人力资产化新路径：TTC借AI破局高端猎头，开启词元经济时代

05-19

华尔街新秀机构一季度持仓曝光：市值跃至137亿美元押注半导体看跌期权

05-19

傅清进任职资格获批，将履新尤溪成功村镇银行董事及董事长一职

05-19

百度Q1财报：AI业务收入占比首超半数，李彦宏展望智能体付费市场前景

05-19

马斯克邀用户测试Cursor Composer 2.5：技术革新，编码能力提升且价格公布

05-19

Box CEO深度剖析：Agent时代来临，软件无界面化将重塑工作流新格局

05-19

奥图股份再闯北交所IPO：2025年营收增长利润下滑董事长和瑞林持股超四成

05-19

点击查看更多 +

全站最新

长安智能化转型成果显著：L3自动驾驶落地，L4及飞行汽车等未来布局加速推进

长安智能化转型成果显著：L3自动驾驶落地，L4及飞行汽车等未来布局加速推进

百度传统业务遇冷营收下滑，AI新势力崛起成业绩新支柱

百度传统业务遇冷营收下滑，AI新势力崛起成业绩新支柱

百度2026年首季财报亮眼：总营收321亿，AI业务成收入增长新引擎

百度2026年首季财报亮眼：总营收321亿，AI业务成收入增长新引擎

怀进鹏在世界数字教育大会发声：借人工智能之力，共促全球教育新发展

怀进鹏在世界数字教育大会发声：借人工智能之力，共促全球教育新发展

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

2026年实测揭秘：开箱即用低门槛openclaw龙虾平台怎么选？一文搞定避坑指南

2026年实测揭秘：开箱即用低门槛openclaw龙虾平台怎么选？一文搞定避坑指南

热门内容

媒体信息

新传播周刊

新传播，传播新经济之声！

本栏最新

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

2026年国产化Agent平台大比拼：功能生态全解析，哪款最适合你的全场景办公？

傅清进任职资格获批，将履新尤溪成功村镇银行董事及董事长一职

傅清进任职资格获批，将履新尤溪成功村镇银行董事及董事长一职

百度Q1财报：AI业务收入占比首超半数，李彦宏展望智能体付费市场前景

百度Q1财报：AI业务收入占比首超半数，李彦宏展望智能体付费市场前景

马斯克邀用户测试Cursor Composer 2.5：技术革新，编码能力提升且价格公布

马斯克邀用户测试Cursor Composer 2.5：技术革新，编码能力提升且价格公布

BOOX文石leaf5与科大讯飞X5深度PK：阅读控与办公族的理想之选大揭秘

BOOX文石leaf5与科大讯飞X5深度PK：阅读控与办公族的理想之选大揭秘

百度2026年首季财报亮眼：AI业务收入占比超半，全栈能力驱动增长

百度2026年首季财报亮眼：AI业务收入占比超半，全栈能力驱动增长

网站首页 | 关于我们 | 联系方式 | 版权隐私 | RSS订阅 | 违规举报鲁公网安备37010202700497号

天脉网由天脉文化中心主办，立足北京，放眼全中国，做首都圈新经济、新文化、新科技资讯平台！
2009-2021 天脉网 (c) All Rights Reserved 鲁ICP备2022032383号-1