当前位置:首页 > IT新闻 > 百度,再见!我们已经不是同一个物种了

百度,再见!我们已经不是同一个物种了

go1231个月前 (10-14)IT新闻141

这两天国产版的 OpenAI o1 来了,Kimi 悄悄上线了它自己的探索版,所谓的探索版其实就是 kimi 版本推理能力的加强版。简单来讲就是,它具备自主海量搜索解决复杂问题的能力。Kimi 探索版能够模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,从而在一定程度上具备了 AI 自主搜索能力。据说,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。它通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,帮助用户更高效地完成分析调研等复杂任务。在内部性能评估测试中,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。

这两天国产版的 OpenAI o1 来了,Kimi 悄悄上线了它自己的探索版,所谓的探索版其实就是 kimi 版本推理能力的加强版。

简单来讲就是,它具备自主海量搜索解决复杂问题的能力。Kimi 探索版能够模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,从而在一定程度上具备了 AI 自主搜索能力。
据说,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。它通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,帮助用户更高效地完成分析调研等复杂任务。在内部性能评估测试中,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。
使用 Kimi 探索版,用户可以提出复杂的问题,比如,“分析一下 2024 年 QS 排名前 10 的高校计算机专业硕士申请情况”,Kimi 探索版会将任务拆解成多个子问题,分别搜索并给出答案,不仅提供 QS 排名前 10 的高校名单,还有详细的申请要求。此外,Kimi 探索版还能处理模糊搜索,帮助用户勾起记忆深处的印象。
好了,废话不多说,我被内测到了体验权限,我们一起试一试效果,看看它的实战能力到底如何?
我问它第一个问题:

东北文艺复兴三杰有哪些作品被改编成了影视剧?

看看它如何应对?
图片
体验还不错,整个过程大约几十秒吧,会展示自己的整个思考推理过程。
它首先把这个问题,拆分成了两个小问题,东北三杰是谁?和 东北三杰的哪些作品被改变成了影视剧。
两个小问题按照顺序依次搜索,层层递进,最后给了一个汇总结果。
最令人意外的就是这哥们还会反思,没错,它还具有反思功能,反思过后给你补充信息。
图片
看看,简直绝了,比人还谦虚,知道自己可能不全面,我再补充补充。
这个过程就像是,我刚刚做完了一件事,感觉还不放心,是不是还有遗漏啊?来个查漏补缺。探索版就像是一个强迫症患者,力求达到完美。
我们再来一个难一点的逻辑来试一试它的推理能力,看看效果如何?
题目是:

有九张纸牌,分别为 1 -9 , 甲乙丙丁四人取牌,每人取两张,现已知甲取得两张牌之和是 10,乙取的两张牌之差是 1,丙取的两张牌之商是 3,请说出剩下一张牌是什么?

这个问题,在上个月 OpenAI o1 刚上线当天,我也问过。
图片
看看到了吗?这里会显示自己的搜索和思考过程。
图片
看看它的推理和分析过程,基本上我对比了一下和 OpenAI o1 整个过程,它俩确实差不多。
我准备给它上难度了,就是让它分析和推理一下我们中国复杂的调休制度,看看它能应对吗?

这是中国 2024 年 9 月 9 日(星期一)开始到 10 月 13 日的放假调休安排:上 6 休 3 上 3 休 2 上 5 休 1 上 2 休 7 再上 5 休 1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?

这个问题,够复杂了吧?看看它的整个分析过程。
如下:
图片
确实分析对了。我们看看它的推理过程哈。
第一步,它列出了放假的调休安排;第二步,它根据放假调休安排,找出来正常的休息日,第三步,它又算了算实际的休息日。最后,它用实际的休息日减去了正常的休息日,算出了,整个假期也就多休息了 4 天。
整个思路还是非常符合逻辑计算过程的。
我再问一个超高难度的题,为难一下它。我相信如果你不熟读《红楼梦》以及不懂天文学、地理学的知识,是很难回答这个问题的,这是一道综合题。
题目就是这个:

林黛玉进贾府的时候,以下哪种情况最有可能发生?
A:太阳直射北回归线;
B:百姓上山采荠菜;
C:黄河侵蚀加强;
D:青藏高原的雪线下降。

图片
它将这个问题分成了两个小问题,它先搜索一下,林黛玉进贾府的时间,找到时间之后,再分析选项和时间的关系,它得出的结论就是:百姓上山采荠菜。
我搜了搜,北方秋天确实有荠菜。
我再让它回答一下《红楼梦》中的未解之谜吧,看看它能不能推理。

在小说《红楼梦》中,林黛玉的父亲林如海去世后,她似乎并没有继承到丰厚的家产,相反,贾府似乎得到了一大笔财富。能不能帮我推理一下,为什么林黛玉没有继承家产?而贾府的这笔财富又是从何而来?

图片
它将问题拆成了两个小问题,分别搜索,然后进行了汇总总结。
整体的效果,总体体验下来,我感觉还可以。
另外,整个体验过程,相信大家都看到了?你扔给它一个大问题,它会自动帮你拆分成一些小问题,然后按照逻辑去搜索,最后再汇总。
这个过程确实是我们人类的思考过程,不过,要想让 Kimi 探索版生成的内容更符合你的要求,其实,我们可以采取思维链的方式,将大问题提出来之后,再列出小问题,让它根据各个小问题去搜索,再整理。
换句话讲,就是让 AI 根据我们的思路去思考,去逻辑推理。
比如:

分析 2024 年中国手机市场的情况,并根据降价预测提供购买建议。
1、搜索并列出 2024 年 1 月至 9 月中国市场手机的销量榜单;
2、使用数学模型或 Python 代码分析 2024 年 1-9 月销量最高的手机;
3、基于历史价格数据和当前趋势预测价格走向;
4、假设预算为 3000 元人民币,分析如何以最优惠的价格购买 top5 中的任意两款手机;
5、将信息整理成表格:列出:手机名称、当前价格、预计降价时间和幅度、推荐购买时间等。
6、综合以上分析给出最佳购买方案和时间建议。

这样的话,我们把思考过程给它,它就像是被我们调教的学生一样,按照我们的思考方式和过程去帮你分析和整理了。
所以,你看,整个过程使用下来,它不仅可以非常丝滑的替代搜索引擎,还可以成为你的私人小秘和助手,让它按照你的思维去思考。
目前 Kimi 探索版还处在内测期间,正逐步分批上线 Web 端,这周一开始开放给全量用户。用户每天可以使用 5 次,而移动端 APP 则将在后续上线该功能。
今天应该大多数用户都可以使用了。
目前使用方法很简单,用 “/” 可以快捷启动探索版,或者点击探索版按钮两种方式。
图片

图片

大家快去看看是不是已经灰度到自己了。

通过体验 OpenAI o1 和 Kimi 探索版,给我最大的一个感受就是 AI 搜索和百度这类搜索引擎不是同一个物种了。


来源:非著名程序员

声明:本站所有内容均为自动采集而来,如有侵权,请联系删除

相关文章

国产数据库圈,为啥那么多水货?

国产数据库圈,为啥那么多水货?

如今,在 “国产化” 的趋势下,国产数据库范畴的创业浪潮一浪高过一浪。截至 2023 年底,中国市场上有将近 300 款数据库产品,约有 100 家数据库厂商。著名投资机构如红杉、高瓴、腾讯等纷纭下场,每家手上投资的数据库至少在 3 个以上,可见资本的青睐。一些数据库凭借自身的实力,拿下了亿元融资,...

阿里云:以后公司20%代码由通义灵码编写

阿里云:以后公司20%代码由通义灵码编写

阿里云正在内部全面推行 AI 编程,应用通义灵码帮助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。阿里云表现:“以后公司 20% 的代码都由通义灵码编写,程序员将更加专注于体系设计和核心业务开发。”据介绍,传统开发模式下,程序员每天须要...

微软正式开源专为Windows打造的Sudo

微软正式开源专为Windows打造的Sudo

微软已在 Windows 11 Insider Preview Build 26052 中宣布实用于 Windows 的 Sudo,并将其在 MIT 协定下进行开源。Sudo for Windows 将许可用户直接从未提权终端窗口运行提权命令。如何启用 Sudo for Windows导航至 Set...

免费编程神器,人人必备的AI编程助手:Fitten Code

免费编程神器,人人必备的AI编程助手:Fitten Code

 现在程序员的工作中,AI的才能已经越来越经常被用到。今天我们要推举一款国产编程神器,它基于自研代码大模型,可以赞助程序员更迅捷、更精确、更高质量地完成编码义务,大幅晋升开发效力,并且它完整免费应用!它就是: Fitten CodeFitten Code 是什么Fitten Co...

27K star!开源AI程序员,可独立完成95%的开发任务

27K star!开源AI程序员,可独立完成95%的开发任务

IT 咖啡馆,摸索无穷可能!恭喜你发现了这个宝藏,这里你会发现优质的开源项目、IT知识和有趣的内容。 应用AI来生成一部分代码比拟常见,那你斟酌过让AI完成全部项目吗?今天我们介绍的开源项目,它愿望为世界上第一位人工智能开发伙伴,可独立完成95%的开发义务,它就是:GPT Pilot&nb...

听说Signals快要登陆React了?

听说Signals快要登陆React了?

“Signals”专门用于管理客户端状况,而且从最近的趋势来看,其很有可能在 React 中施展作用。就在上周,Dashi Kato(Waku 的缔造者)宣布了 use-signals,一个面向 TC39 signals 的试验性 React hook,旨在演示 Signals 如何在 React...