长按上方二维码3秒识别二维码

OpenAI开源BrowseComp,重塑Agent浏览器评测

2025-04-11 04:44:21 56

币界网报道:今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整合、准确性校准方面非常优秀。(AIGC开放社区)

最新快讯

  • 05月10日23分钟前

    某巨鲸地址过去1小时从币安提取1139枚BTC

     据 Onchain lens 监测,某 bc1q57 开头鲸鱼地址在过去一小时内从币安累计提现了 1139 枚 BTC(价值约合 1.1743 亿美元)。 目前,该巨鲸地址持有 2616 枚 BTC(价值约合 2.695 亿美元)。

  • 05月10日25分钟前

    美国现货比特币ETF昨日净流入3.214亿美元

    据Farside Investors监测,昨日美国现货比特币ETF昨日净流入3.214亿美元。

  • 05月10日27分钟前

    美国现货以太坊ETF昨日净流入1760万美元

    据Farside Investors监测,美国现货以太坊现货ETF昨日净流入1760万美元。

  • 05月10日27分钟前

    某一周前建仓PEPE的巨鲸地址卖出1万亿枚PEPE,获利超350万美元

     据链上数据分析师@ai_9684xtpa 监测,随着 PEPE 上涨,早在一周前就埋伏 PEPE 的“低买高卖 WBTC 获利 1426 万美元的 Smart Money 地址”借此再次获利 353 万美元。过去 14 小时疑似卖出 1 万亿枚 PEPE(价值约合 1248 万美元),剩余 1 万亿枚目前仍浮盈 352 万美元,建仓均价 0.00000895 美元。

  • 05月10日28分钟前

    某鲸鱼地址卖出1万亿枚PEPE,获利353万美元

    据链上数据分析师 @ai_9684xtpa 监测,随着 PEPE 上涨,早在一周前就埋伏 PEPE 的「低买高卖 WBTC 获利 1426 万美元的 Smart Money 地址」借此再次获利 353 万美元。过去 14 小时疑似卖出 1 万亿枚 PEPE(约合 1248 万美元),剩余 1 万亿枚目前仍浮盈 352 万美元,建仓均价 0.00000895 美元。

  • 05月10日29分钟前

    某鲸鱼以2277美元的价格增持9023枚ETH

    据Lookonchain监测,3 个月前,一位鲸鱼以 2,740 美元的价格卖出了所有的 ETH,损失了 1100万美元。一个月前,他再次入场,以 1502 美元的价格买入 2713 枚ETH(407 万美元)。 随着以太坊最近的反弹,他又加倍买入,以 2277 美元的价格再买入 9023 枚ETH(2055 万美元)。

  • 05月10日50分钟前

    交易员Eugene:比特币或冲击历史新高,预计山寨币会出现强劲反弹

     交易员 Eugene Ng Ah Sio 在个人频道发文表示,自己尽管这次上涨方向判断正确,但因提前被震荡止损,实际收益不佳。 展望后市,这次涨到 10 万美元确认了之前 9 万美元的支撑反转,现在市场很可能再次冲击历史新高,这原本不是预期的情况,但来自微策略和 ETF 的资金似乎源源不断。相比之下,直到昨天大多数币圈老玩家都还在观望(甚至做空),随着历史新高预期让市场重新燃起热情,预计山寨币总市值会出现强劲的反弹上涨。

  • 05月10日54分钟前

    加密KOLEdgy:Cointelegraph官号被盗后向其发送私信企图窃取X账号

     加密 KOL Edgy 在 X 平台发文表示,Cointelegraph 官方账号向其发送私信,要求审查一篇涉及 Edgy 本人相关内容的文章。点击 Cointelegraph 官推给出的链接后,将跳转至域名为“Cointetegraph”的冒牌网站并要求登录 X 账号。 此前消息,Cointelegraph 的 X 账号疑似被黑客入侵,其发布链上代币信息并关闭评论。

正在加载