开放深度搜索：缩小专有搜索和开源 Search AI 之间的差距

Published on

September 1, 2025

April 2, 2025

Read time:

6 mins

Tl;dr:

Open Deep Search (ODS) 是一个开源代理方框架，围绕着可选的哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈 AI 解决方针和开源同类解决方针之后的差距
帧数基准测试的准确率为 75.3%，比 OpenAI 的 GPT-4O 搜索预览（65.6%）高出近 10 个点
SimpleQA 的准确率为 88.3%，几乎与 GPT-4O 搜索预览版的 90.0% 相当
我们邀请开发人员和开发者在我们的 BIRXBRONGASCRAPENCHAGESKRAPHENCRAGE 上进行创新，从搜寻到 AI 排行榜的几位名字 LIEFRESTMOUTH 开始

LLM的封闭式和公开发行股之间的差距太大（想想GPT4和DeepSeek R1）。但是，高级/代理/人工智能搜索的封面闭式和开放式搜索的封闭式和开放式的间隔在巨人的大差距中（想象一下gemini或perplexity和非真实选项）。在工作中，Sentient Research 弥补了这一巨型差距。我们发布布 打开深度搜索 (ODS)，一个开源代理框架，用于缩小专家有人智能搜索解决方针及其开源替代方案之间的性质差距。赔率通过提供完全开源的人工智能搜索框架，消除了封闭式人工智能的限制，该框架构的性能与专有产品的性质相匹配，而且超级会过专有产品的性能。通过普及最先进的搜索技术，我们作为开发人员和建设者创造了公平的竞争环境，以推介进先锋的搜索智能。

结果：匹配闭源巨头

Sentient Close Source Giants Comparison Results | Sentient AGI

当与开源 deepSeek-R1 模版结尾使用时，ODS 可以实用：

帧数基准测试的准确率为 75.3%，比 OpenAI 的 GPT-4O 搜索预览（65.6%）高出近 10%
SimpleQA 的准确率为 88.3%，几乎与 GPT-4O 搜索预览版的 90.0% 相当

来自从 Deepmind 的框架评分估计基准测试是有的 doJump 问题，但现在需要从多个信息源源进行正确检查，然后需要准确汇总检查到信息。我们之所以选择框架，是因为该死的基准测试工具有足部的战士性，以至于 SOTAPECENTY 有解决方法然在困难中存活，而且数据估计未用尽。

Open Source Giants - ODS-v2 achieves the best accuracy | Sentient AGI

OpenAI对SimpleQA的另一个基准测试更简单，但更受欢迎。上面的排行榜包含了在网上找到的几个自我的报告的分数。我们没有核这些实体的分数，但信任消息来源。另一方面，由于ODS是开源的，任何人都可以证明我们的证书分数。一件事是，DeepSeek-R1已被曝光了很多事实，而且在不访问网络的情况下面，还有 82.4% 的准确性。从这个意义上讲，SimpleQA 可能不是测试人员 smetryAvens高级推理能量力的最佳评分估计基准。每个问题仅测试单条信息的真实性。ODSLIONALOPER开源推荐 LLM进展，例如 Deepseek-R1，来提高其在搜索中最新发布的内容。

‍

打开 “深度搜索”

OpenDeepSearch是一款轻巧但功能强大的搜索工具，专为与人工智能代理的无缝集成和缝纫设计。它支持深度网络搜索和检查，并针对性地拥抱脸部的smolagents生态系统进行了优化。ODS 由于两个组件组合，可与用户选择器的基本大型语言模型 (LLM) 配合使用：开放搜索工具和开放推理代理。开放推理代理解释给定任务的业务，并通过协调一系统操作来完成任务业务，其中包括调用工具，其中一是开放搜索工具。OptenSearch Tool是一种全新的网络搜索工具，其性质优于专有搜索工具。两位玩家都是完全开源的，可以通过下方的GitHubStorebStoreku进行测试。

打开搜索工具

与仅仅将原创搜索引擎结果传说哈哈的现实有开源替代方案不一样，我们的开放搜索工具实现了复杂的搜索流程，其中：

必需时智能地对查询进行改写，以捕获用户的隐含意图
从热门搜索片段中提示取消和整合上下文
应用高级块分和重新排名的名字
为维基百科、arXiv 和 pubMed 等主要源实现自定义网站处理

这些改进了极限大地提高了检查信息的质量，因此我提供了更好的工作环环境。

在以下来自 SimpleQA 的示例中，ODS 通过交叉检查多个来源，利用 ODS 从开放搜索工具中检查到的高质量上文来确认答案。另一方面，Perplexity 声纳推理无疑是通过其搜索引擎检测的相关信息。

打开推荐

我们提供了两种推理代理的变体：

ODS-v1: 基于 “思想链接” 和 “React boxBrackle”，通过分支思考/行动/观察周期和工具集成 hundaxangModype 的推荐能力。ODS-v1 代理可以访问三个独立的工具：开放搜索工具、基于 Wolfram-Alpha 的计算机和 “继续思考” 工具。
ODS-v2: 基于 codeDocLink 和 codeAct 框架，使模模能生成可执行的 Python 代码，以更便于更精确地推理和工具使用。ODS-v2 代理可以访问开放搜索工具。

两个代理都可以智能地协同调一系列的操作工作，以适应每一个查询的复杂性。ODS-v1 利用 React 推荐 React 的少量量化示例，这些示例例子将思考、行动和观察步骤交叉在一起，作为上面的示例示例，指示演示模型调用工具。与对每一个查询使用相似搜索次数的固定方法不一样，ods-v1和ods-v2都会明智地确诊何时需要进行额外搜索。

这些优化最大限度地提示提高了效率和准确性，使我们能够超越专有的闭源同类产品的同类产品。如果 ODS 表现出来的 PROVENSEOPTENSENSEARCH 工具的性能改进，则应归功于开放推介代理。

在以下帧的示例中，ODS 的意思是需要进行第二次搜索，再搜索以找到 King Crimson 主唱的出生年份身份，并正确认 “1946” 回复了这个问题。另一方面，困惑无力找出猩红之王乐队的负责人。