
- Open Deep Search (ODS) 是一个开源代理方框架,围绕着可选的哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈 AI 解决方针和开源同类解决方针之后的差距
- 帧数基准测试的准确率为 75.3%,比 OpenAI 的 GPT-4O 搜索预览(65.6%)高出近 10 个点
- SimpleQA 的准确率为 88.3%,几乎与 GPT-4O 搜索预览版的 90.0% 相当
- 我们邀请开发人员和开发者在我们的 BIRXBRONGASCRAPENCHAGESKRAPHENCRAGE 上进行创新,从搜寻到 AI 排行榜的几位名字 LIEFRESTMOUTH 开始
LLM的封闭式和公开发行股之间的差距太大(想想GPT4和DeepSeek R1)。但是,高级/代理/人工智能搜索的封面闭式和开放式搜索的封闭式和开放式的间隔在巨人的大差距中(想象一下gemini或perplexity和非真实选项)。在工作中,Sentient Research 弥补了这一巨型差距。我们发布布 打开深度搜索 (ODS),一个开源代理框架,用于缩小专家有人智能搜索解决方针及其开源替代方案之间的性质差距。赔率通过提供完全开源的人工智能搜索框架,消除了封闭式人工智能的限制,该框架构的性能与专有产品的性质相匹配,而且超级会过专有产品的性能。通过普及最先进的搜索技术,我们作为开发人员和建设者创造了公平的竞争环境,以推介进先锋的搜索智能。
结果:匹配闭源巨头

当与开源 deepSeek-R1 模版结尾使用时,ODS 可以实用:
- 帧数基准测试的准确率为 75.3%,比 OpenAI 的 GPT-4O 搜索预览(65.6%)高出近 10%
- SimpleQA 的准确率为 88.3%,几乎与 GPT-4O 搜索预览版的 90.0% 相当
来自从 Deepmind 的框架评分估计基准测试是有的 doJump 问题,但现在需要从多个信息源源进行正确检查,然后需要准确汇总检查到信息。我们之所以选择框架,是因为该死的基准测试工具有足部的战士性,以至于 SOTAPECENTY 有解决方法然在困难中存活,而且数据估计未用尽。

OpenAI对SimpleQA的另一个基准测试更简单,但更受欢迎。上面的排行榜包含了在网上找到的几个自我的报告的分数。我们没有核这些实体的分数,但信任消息来源。另一方面,由于ODS是开源的,任何人都可以证明我们的证书分数。一件事是,DeepSeek-R1已被曝光了很多事实,而且在不访问网络的情况下面,还有 82.4% 的准确性。从这个意义上讲,SimpleQA 可能不是测试人员 smetryAvens高级推理能量力的最佳评分估计基准。每个问题仅测试单条信息的真实性。ODSLIONALOPER开源推荐 LLM进展,例如 Deepseek-R1,来提高其在搜索中最新发布的内容。
打开 “深度搜索”
OpenDeepSearch是一款轻巧但功能强大的搜索工具,专为与人工智能代理的无缝集成和缝纫设计。它支持深度网络搜索和检查,并针对性地拥抱脸部的smolagents生态系统进行了优化。ODS 由于两个组件组合,可与用户选择器的基本大型语言模型 (LLM) 配合使用:开放搜索工具和开放推理代理。开放推理代理解释给定任务的业务,并通过协调一系统操作来完成任务业务,其中包括调用工具,其中一是开放搜索工具。OptenSearch Tool是一种全新的网络搜索工具,其性质优于专有搜索工具。两位玩家都是完全开源的,可以通过下方的GitHubStorebStoreku进行测试。

打开搜索工具
与仅仅将原创搜索引擎结果传说哈哈的现实有开源替代方案不一样,我们的开放搜索工具实现了复杂的搜索流程,其中:
- 必需时智能地对查询进行改写,以捕获用户的隐含意图
- 从热门搜索片段中提示取消和整合上下文
- 应用高级块分和重新排名的名字
- 为维基百科、arXiv 和 pubMed 等主要源实现自定义网站处理
这些改进了极限大地提高了检查信息的质量,因此我提供了更好的工作环环境。
在以下来自 SimpleQA 的示例中,ODS 通过交叉检查多个来源,利用 ODS 从开放搜索工具中检查到的高质量上文来确认答案。另一方面,Perplexity 声纳推理无疑是通过其搜索引擎检测的相关信息。

打开推荐
我们提供了两种推理代理的变体:
- ODS-v1: 基于 “思想链接” 和 “React boxBrackle”,通过分支思考/行动/观察周期和工具集成 hundaxangModype 的推荐能力。ODS-v1 代理可以访问三个独立的工具:开放搜索工具、基于 Wolfram-Alpha 的计算机和 “继续思考” 工具。
- ODS-v2: 基于 codeDocLink 和 codeAct 框架,使模模能生成可执行的 Python 代码,以更便于更精确地推理和工具使用。ODS-v2 代理可以访问开放搜索工具。
两个代理都可以智能地协同调一系列的操作工作,以适应每一个查询的复杂性。ODS-v1 利用 React 推荐 React 的少量量化示例,这些示例例子将思考、行动和观察步骤交叉在一起,作为上面的示例示例,指示演示模型调用工具。与对每一个查询使用相似搜索次数的固定方法不一样,ods-v1和ods-v2都会明智地确诊何时需要进行额外搜索。
这些优化最大限度地提示提高了效率和准确性,使我们能够超越专有的闭源同类产品的同类产品。如果 ODS 表现出来的 PROVENSEOPTENSENSEARCH 工具的性能改进,则应归功于开放推介代理。
在以下帧的示例中,ODS 的意思是需要进行第二次搜索,再搜索以找到 King Crimson 主唱的出生年份身份,并正确认 “1946” 回复了这个问题。另一方面,困惑无力找出猩红之王乐队的负责人。

结论
开启深度搜索的代谢不仅是一项技术成就,而且是尖端的搜索人智能技术可访问性的。通过缩小开源和闭源解决方针之间的差距,是:
- p及道 转到强者的搜索人物智能功能,使全球开发人员能够利用最先进的技术进行开发和创新
- 提高透明度 通过使搜索在系统中搜寻
- 鼓鼓创新 通过降低初创企业和独立开发者的进门来降低初创企业和独立开发者的进度
两个版本的赔率的存储库可在以下网址中获取 https://github.com/sentient-agi/OpenDeepSearch,我们邀请社区在工作基础上再来一遍、改进和扩展我们的作品。
年新的开源推荐哈哈的发布会,ODS 提供了一个即插即用框架,该框架将无缝缝合合这些进步,确切地保存 AI 解决方针和专家搜索智能解决方针保守竞争力,至超越专有同类解决方案。
搜索人工智能领地域闭源主导的时代即将结束。打开深度搜索只是我们的强大人物,并将在全球开发者社区的交互中开始。
立即试用开启深度搜索,加入我们,共塑造人工智能搜索的!
参考文献
- [1] OpenAI。 https://github.com/openai/simple-evals,2025
- [2] xAI。 https://x.ai/blog/grok-3,2025 年。
- [3] PerplexityAI。 https://www.perplexity.ai/hub/blog/introducing-the-sonar-pro-api,2025 年。
- [4] Perplexity AI, Inc. Perplexity AI,2024 年。 https://www.perplexity.ai。
- [5] OpenAI。 https://platform.openai.com/docs/models/gpt-4o-search-preview,2025 年。
- [6] 威尔·布莱克。 https://exa.ai/blog/api-evals,2025 年。
- [7] 菲利普·米兹拉希。 https://www.linkup.so/blog/linkup-establishes-sota-performance-on-simpleqa,2025
- [8] perplexityAI。 https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research,2025 年。
- [9] 深度寻找。 https://www.deepseek.com,2025 年。
- [10] 郭大雅、杨德保健、张浩威、宋、张若雨、徐润新、朱启豪、马世界、王培一、毕晓等deepseek-R1:通过化学强化习激我的推荐能力。arXiv 预印本 arxiv: 2501.12948,2025 年。

