百度,再见!我们已经不是同一个物种了
这两天国产版的 OpenAI o1 来了,Kimi 悄悄上线了它自己的探索版,所谓的探索版其实就是 kimi 版本推理能力的加强版。简单来讲就是,它具备自主海量搜索解决复杂问题的能力。Kimi 探索版能够模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,从而在一定程度上具备了 AI 自主搜索能力。据说,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。它通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,帮助用户更高效地完成分析调研等复杂任务。在内部性能评估测试中,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。
这两天国产版的 OpenAI o1 来了,Kimi 悄悄上线了它自己的探索版,所谓的探索版其实就是 kimi 版本推理能力的加强版。简单来讲就是,它具备自主海量搜索解决复杂问题的能力。Kimi 探索版能够模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,从而在一定程度上具备了 AI 自主搜索能力。据说,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。它通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,帮助用户更高效地完成分析调研等复杂任务。在内部性能评估测试中,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。使用 Kimi 探索版,用户可以提出复杂的问题,比如,“分析一下 2024 年 QS 排名前 10 的高校计算机专业硕士申请情况”,Kimi 探索版会将任务拆解成多个子问题,分别搜索并给出答案,不仅提供 QS 排名前 10 的高校名单,还有详细的申请要求。此外,Kimi 探索版还能处理模糊搜索,帮助用户勾起记忆深处的印象。好了,废话不多说,我被内测到了体验权限,我们一起试一试效果,看看它的实战能力到底如何?体验还不错,整个过程大约几十秒吧,会展示自己的整个思考推理过程。它首先把这个问题,拆分成了两个小问题,东北三杰是谁?和 东北三杰的哪些作品被改变成了影视剧。两个小问题按照顺序依次搜索,层层递进,最后给了一个汇总结果。最令人意外的就是这哥们还会反思,没错,它还具有反思功能,反思过后给你补充信息。看看,简直绝了,比人还谦虚,知道自己可能不全面,我再补充补充。这个过程就像是,我刚刚做完了一件事,感觉还不放心,是不是还有遗漏啊?来个查漏补缺。探索版就像是一个强迫症患者,力求达到完美。我们再来一个难一点的逻辑来试一试它的推理能力,看看效果如何?有九张纸牌,分别为 1 -9 , 甲乙丙丁四人取牌,每人取两张,现已知甲取得两张牌之和是 10,乙取的两张牌之差是 1,丙取的两张牌之商是 3,请说出剩下一张牌是什么?
这个问题,在上个月 OpenAI o1 刚上线当天,我也问过。看看它的推理和分析过程,基本上我对比了一下和 OpenAI o1 整个过程,它俩确实差不多。我准备给它上难度了,就是让它分析和推理一下我们中国复杂的调休制度,看看它能应对吗?这是中国 2024 年 9 月 9 日(星期一)开始到 10 月 13 日的放假调休安排:上 6 休 3 上 3 休 2 上 5 休 1 上 2 休 7 再上 5 休 1。请你告诉我除了我本来该休的周末,我因为放假多休息了几天?
第一步,它列出了放假的调休安排;第二步,它根据放假调休安排,找出来正常的休息日,第三步,它又算了算实际的休息日。最后,它用实际的休息日减去了正常的休息日,算出了,整个假期也就多休息了 4 天。我再问一个超高难度的题,为难一下它。我相信如果你不熟读《红楼梦》以及不懂天文学、地理学的知识,是很难回答这个问题的,这是一道综合题。它将这个问题分成了两个小问题,它先搜索一下,林黛玉进贾府的时间,找到时间之后,再分析选项和时间的关系,它得出的结论就是:百姓上山采荠菜。我再让它回答一下《红楼梦》中的未解之谜吧,看看它能不能推理。在小说《红楼梦》中,林黛玉的父亲林如海去世后,她似乎并没有继承到丰厚的家产,相反,贾府似乎得到了一大笔财富。能不能帮我推理一下,为什么林黛玉没有继承家产?而贾府的这笔财富又是从何而来?
它将问题拆成了两个小问题,分别搜索,然后进行了汇总总结。另外,整个体验过程,相信大家都看到了?你扔给它一个大问题,它会自动帮你拆分成一些小问题,然后按照逻辑去搜索,最后再汇总。这个过程确实是我们人类的思考过程,不过,要想让 Kimi 探索版生成的内容更符合你的要求,其实,我们可以采取思维链的方式,将大问题提出来之后,再列出小问题,让它根据各个小问题去搜索,再整理。换句话讲,就是让 AI 根据我们的思路去思考,去逻辑推理。分析 2024 年中国手机市场的情况,并根据降价预测提供购买建议。1、搜索并列出 2024 年 1 月至 9 月中国市场手机的销量榜单;2、使用数学模型或 Python 代码分析 2024 年 1-9 月销量最高的手机;4、假设预算为 3000 元人民币,分析如何以最优惠的价格购买 top5 中的任意两款手机;5、将信息整理成表格:列出:手机名称、当前价格、预计降价时间和幅度、推荐购买时间等。
这样的话,我们把思考过程给它,它就像是被我们调教的学生一样,按照我们的思考方式和过程去帮你分析和整理了。所以,你看,整个过程使用下来,它不仅可以非常丝滑的替代搜索引擎,还可以成为你的私人小秘和助手,让它按照你的思维去思考。目前 Kimi 探索版还处在内测期间,正逐步分批上线 Web 端,这周一开始开放给全量用户。用户每天可以使用 5 次,而移动端 APP 则将在后续上线该功能。目前使用方法很简单,用 “/” 可以快捷启动探索版,或者点击探索版按钮两种方式。通过体验 OpenAI o1 和 Kimi 探索版,给我最大的一个感受就是 AI 搜索和百度这类搜索引擎不是同一个物种了。
声明:本站所有内容均为自动采集而来,如有侵权,请
联系删除