最近的ai搜索都在纷纷升级自己家的ai搜索引擎,从kimi推出国内首个能思考的搜索模型——kimi探索版之后。

前几天360ai搜索也偷偷上线了慢思考模式,多个思维链,多个智能模型分工合作。

智谱清言同样上线了他们家的多级推理功能,精准搜索,让ai长出了脑子。

这三家的ai搜索能力到底怎么样?今天用一篇文章对这三家的搜索进行一个测评。

01把问题当成问题本身。

其实刚刚我提到的那个问题,这三家的工具哪家更厉害?

这本身就是一个问题,既然我们本身就是测评的搜索工具,干嘛不直接搜答案不就得了?

所以其实问题我和大家遇到的都一样,无非是我将问题具体化,并且结合了工具具体去得到问题的结果而已。

把刚刚的问题进行细分,如果要做一个详细的对比,这些工具需要对比哪些方面?

我能想到的至少有原理,功能,搜索质量,搜索速度这几项,于是我整理了以下这个问题,发给了三个搜索引擎分别帮我搜索。

问题如下:

可以看到,三个工具的搜索结果直接按照我的要求已经把对比表格制作完成了,这种整理的工作也不需要我来做了,直接一步到位。

可以看下三家分别整理的结果:

kimi探索版:

智谱清言:

360AI搜索:

当然到这里靠ai整理完结果这篇文章就完事儿了?

没这么水。

具体来看看各家工具的亮点,以及深度问题的测试。

02三家工具各有亮点。

首先先来看看ai已经总结的,通过对比分析,三家模型各有优势,360的慢思考模式适合解决复杂任务并提高回答质量,智谱清言的多级推理在深度推理和速度上有明显优势,kimi探索版在处理大规模数据和复杂问题上有突出表现。

说是这么说,实际用问题测试一下就可以了。

我又再次搜索了以下问题:

假设我在2024年9月2日有100000元,对比一下截至9月30日,购买腾讯港股和购买贵州茅台哪个方案的收益率更高?具体收益额会高出多少?

这个问题要回答完成,至少要经过数据的搜集,计算,整理以及反思纠错的过程。

智谱清言的率先调用了非常高大上的代码进行了这一任务的处理,但是效果上还有点欠缺。

首先可以看到竟然说无法获取实时数据,好歹今年的也获取一下啊,没有。直接用的历史数据进行估算的,答案就完全偏离了。

当然这也侧面能看出智谱清言对于调用其他工具的能力是更加厉害的,已经是搜索+多模态的感觉了,就是搜索上在这个问题的测试下还差点。

再来看360和kimi探索版,起码在第一步数据搜索上都没大问题,都取到了9月2日和30日的股价。

然后两个工具都开始了详细的计算过程,当然很明显的是kimi的真的是在计算的感觉,很详细,很调理清晰。

为什么两个结果有点出入,在9月2日的股价稍微有出入了,一个是1372.60,一个是1395.

然后导致了后续计算结果的偏差,在各自的初始数据下是都计算没问题的。

这一轮下来,其实对kimi的答案相对是更满意的,本身kimi的大模型就不错,加上搜索功能,它本身的问题能力也不会很差。

360搜索在搜索基础上加上了深度思考,答案还会是有点在搜索的感觉,而不是基于信息的深度处理,而且也只能进行一轮对话目前。