百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

2025-09-02 05:54:57 - 风事

「雷峰网」二十多年前,百川搜索引擎的智能主打做搜发明极大地方便了人们获取信息,很快搜索引擎便成为互联网时代第一流量入口,首款索但索谷歌、应用百度更是懂搜凭借搜索引擎在 PC 互联网时代占据统治地位,成为两大巨头,百川武汉理工大学内幕评价多年以来,智能主打做搜两者在搜索方面的首款索但索地位无人能撼动。

ChatGPT 问世后,应用OpenAI 背后金主微软率先将 GPT 模型集成到旗下Bing 搜索引擎中,懂搜自此拉响了重塑搜索的百川警报。

看到机会,智能主打做搜国内外很快便出现了一批 AI 搜索产物,首款索但索例如此前大火的应用Perplexity、秘塔、懂搜360 搜索、天工AI……可以说 2023 年是 AI 搜索元年。

Perplexity、秘塔这些 AI 搜索产物他们应该都做过同一个梦:颠覆传统搜索。

近日,大模型明星创业公司百川智能也发布了一款号称“懂搜索”的 AI 助手「百小应」。让人颇受关注的是,百川智能创始人王小川,在上个互联网时代因为做出了搜狗搜索而声名大噪,此番入局大模型创业,首款产物跟搜索相关,完全在情理之中,在大家的认知里,如果在国内选两个最能做好AI搜索的人,其中一个必然是王小川。

但意料之外的苏州师范大学门事件评论是,王小川表示,百小应不是对传统搜索的升级,他不做搜索 2.0。

“大模型创造的是新物种,要让 AI 从工具变成伙伴,而百小应就是一款在模型能力有限的情况下从 AI 工具到 AI 伙伴的过渡型产物。”

在实践上他也很知行合一,跟 Perplexity、秘塔这些用大模型提升AI搜索体验的产物不同,定位AI助手的百小应是把搜索作为一个提升回答准确性、丰富性的工具。

百小应,一个懂搜索的AI助手

搜索不仅能让大模型实时获取最新信息,还能有效解决大模型的幻觉问题,是大模型落地应用的关键工艺之一。

但如何在AI应用,尤其是AI助手类产物中用好搜索,不同的企业却有着不一样的理解。在百川智能认为,今天的 AI 搜索产物更多是搜索聚合,即把搜索结果做总结,但这样是不够的,从客户体验的角度来看,AI助手需要能像人一样掌握专业的搜索技能,利用好搜索这个工具,也就是“懂搜索”。

在此基础上,还需要具备“会提问”的能力,让模型能清晰引导客户表达自己的需求。传统的搜索更多是通过关键词去搜,无法理解关键词背后客户的获取信息的意图。今天通过大模型用自然语言去对话、交流,让机器具备了理解我们的意图的能力,但这个过程中很多时候客户表达不清晰、不准确,导致客户对一些搜索结果仍然不满意,对此「百小应」可以通过提问、反问的方式去引导客户将需求表达的更具体、清晰,进而得到更准确的结果。

为了能够用好搜索工具,百川智能为「百小应」打造了定向搜索、多轮搜索等能力,不仅让「百小应」能够在与客户的交流中自主思考是否需要调用搜索工具,还能主动决策应该采用哪种搜索行为。

例如问「百小应」“帮我找下《斗罗大陆IV终极斗罗》的资源?”,它能精准定位你的问题领域——电子书、有声书、影片领域,能直接访问权威网站,在网站中产生搜索,最后定位到拉看书网、有声听书网、哔哩哔哩,点链接就能进入到网站:

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

这是「百小应」采用了定向搜索的策略,它搜索的时候不是泛泛的查找,而是直接查找与《斗罗大陆IV终极斗罗》资源最相关的网站。

面对复杂的问题,人会根据之前的搜索回应,进行第二次、第三次甚至更多轮次的搜索,百小应也拥有这种能力,针对客户提出的问题,「百小应」在得到搜索结果之后会结合客户的问题进行反思,自主判断当前资料是否足够详实,进而自主决策是否需要进行更多轮次搜索获取更多信息。

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

相比单轮搜索,在市场调研、产业分析等复杂场景下,多轮搜索能够有效地获取更专业、更有深度的信息。

在搜索结果呈现方面,「百小应」同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为问答的参考资料,将“搜索结果嵌入回答”,从而使回答更加清晰、饱满。

例如让「百小应」分析“新能源汽车市场格局,小米入场后有什么作用”,它便会将搜索到的信息直接引用到回答当中作为信息支撑的一部分:

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

在会提问方面,百小应能够在客户问题的基础上通过一系列提问来帮助客户明确自身需求。例如问「百小应」“车门打不开了怎么办?”,它会先问你车的品牌以及型号,是车内打不开还是车外打不开?你告诉它车品牌型号和车内打不开之后,它会针对性的告诉你正确的开锁方法:

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

「百小应」还非常具有“理科”思维,很擅长将结果结构化呈现,如下图:

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

除了懂搜索和反问功能以外,客户还能在「百小应」中上传PDF、word文档,或者直接输入网页链接(URL),阅读并分析书籍、报告、学术论文等长篇内容,仅用一分钟便能读完上市公司财报:

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

客户在提问的同时还可以同步上传图片,对图片内容进行解读,或者将图片作为补充材料,获取更精准的回答;并且,它还支持客户通过语音的方式进行交互。

王小川认为,如Perplexity、秘塔这些产物做的都是搜索总结类的工作,搜索引擎公司自己就能干。如果只是搜索结果的总结,就只是对传统搜索的升级,在价值创造和竞争力上,无法跟传统搜索大厂竞争,这不是今天创业公司或朝着 AI 伙伴前进路上 AI助手应该做的事。

“AI 助手正确的路径是嵌入搜索结果,而不是总结搜索结果,要把搜索结果作为观点、论点、论证,跟模型的结果融合在一起。”

这种判断背后是王小川对大模型时代的超级应用的思考,他认为,要让大模型像人一样思考,超级应用应该朝着伙伴方向走。

大模型时代,王小川眼里的超级应用?

从创立之初,王小川就一直提百川要有自己的超级应用。

相比互联网时代动辄上亿客户的应用,当下一个拥有 100 亿 DAU 的 AI 产物就能引起轰动,但王小川认为现在超级应用还未出现,从客户体量上看还得再提升两个数量级,DAU 达到 3 千万到 3 亿之间才能称之为超级应用。

“当下最火的两款应用,微信拥有 13 亿+DAU,抖音拥有 4 亿+DAU,大模型时代的超级应用应该是如抖音这样的一个产物。”

过去做输入法、搜索引擎、浏览器的经历,让百川智能知道一个应用到什么程度才会变成一个被广泛使用的产物。

如果「百小应」要成为一个超级应用,王小川认为应该具备以下特点:

首先,模型能力能达到 60%-80% 的可靠性,未来模型一定要和搜索做结合,因为模型是一个推理引擎,有了搜索之后,它的知识的广泛程度和真实度都能得到提升。

第二,作为助手能充分理解客户的意图,变成某个行业的专业人士一样。AI 能像人一样思考、工作、学习,最后就会变成一个职业人士,例如法律助手、医疗助手。

接下来,对于「百小应」王小川称并不会通过营销战术去宣传,他认为一些厂商发产物可能是为了拉融资,这不是一种健康的方式,百川会把精力放在打磨产物、发掘产物价值上,做出真正好的产物。

百川的“双轮驱动”

“超级模型+超级应用”的双轮驱动一直是百川智能的增长理念。而此次「百小应」发布,刚好补齐了应用上的拼图,百川智能可以算是真正走到“双轮驱动”的路上。

虽然现在既没到超级模型,也没到超级应用,即便「百小应」还只是一个过渡型的产物,但王小川称团队心中有超级应用的画面感,尤其是从去年4月份工作到今年5月份这一年的时间,团队有足够的手感。

超级应用的诞生,最根本还是要看模型能力。

在模型基础能力层面,百川智能一直在持续升级。此次跟「百小应」一起发布的还有 Baichuan 4大模型,作为百川智能发布的最新一代基座大模型,Baichuan 4相较上一代大模型Baichuan 3在各项能力上均有显著提升。其中通用能力超过 10%,指令跟随提升20%,信息理解提升9%,知识问答提升15%,创作提升16%,逻辑推理提升15%;专项能力方面,数学提升14%,代码提升9%。

此外,在国内权威大模型评测机构SuperCLUE的评测中,Baichuan 4模型能力国内第一。而此前,在 SpuerCLUE 发布的“中文大模型基准测评2024年4月报告中”,Baichuan 3就已经以73.32分的成绩超越文心一言4.0、通义千问2.1、GLM 4、Moonshot等大模型,摘得了国内大模型排名的头筹。

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

不仅如此,与国外主流大模型对比,Baichuan 4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

「雷峰网(公众号:雷峰网)」Baichuan 4能在短时间内取得模型能力的突破,源于其在训练过程中引入了诸多业内领先的工艺优化手段。例如,在预训练阶段采用了基于Model-based+Human-based的协同信息筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对信息的利用;在对齐阶段重点优化了模型Reasoning、Planning、Instruct following能力,通过loss驱动的信息选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。同时突破RLHF和RLAIF融合的RLxF强化学习对齐工艺,大幅提升模型的指令遵循等能力。

此外,Baichuan 4在多模态领域也取得了不错的成绩,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上表现优异,大幅领先Gemini Pro、Claude3-sonnet等多模态模型。

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

同时,为了让更多开发者、企业客户能够像「百小应」一样更好的使用百川大模型的能力,百川智能推出了全新的 MaaS+AaaS 支持。

MaaS 版块由基座模型组成,并且在综合了成本和性能的考量下将 API 分为旗舰版和专业版。旗舰版将全量开放 Baichuan 4 的各项能力。此前,在 SuperCLUE 的金融知识百科能力上 Baichuan 3 就已取得了A+的最高评级,升级之后的 Baichuan 4 则更强。

专业版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-192K 两款模型,在价格方面相比旗舰版 Baichuan 4 更实惠,且均针对企业用的高频场景进行了针对性优化,综合测试相比 GPT3.5 整体效果提升 8.9%。

百川还在 Baichuan 4 基础上针对 Agent 构建推出 Assitant API,随着大模型的应用在各领域持续深入,Agent 已经成为企业的关注重点。在此背景下,百川智能对模型的工具调用能力进行了特殊强化,不仅支持 Code interpreter、RAG 内建工具,还支持自定义工具调用,方便企业接入各种丰富复杂的 API。评测结果显示其工具调用能力接近Open AI assistant API。

百川本次发布的Assitant API现已正式开启内测邀请,感兴趣的客户均可申请免费试用。地址:https://platform.baichuan-ai.com/docs/assistants。



雷峰网原创文章,未经授权禁止转载。详情见转载须知。

百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.0

- END -

4

英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」

英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」

作者丨赖文昕 马蕊蕾编辑丨陈彩娴大模型浪潮一起,被视为是大模型最佳载体的机器人,热度也随之飙升,「具身智能」这个在1950年由艾伦·图灵提出的概念,时隔75年再次成为了 AI 界的宠儿。2024年才过

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

作者 | 赖文昕编辑 | 陈彩娴上个月初,上海世界人工智能大会WAIC 2024)展出人形机器人「十八金刚」引爆会场。一个月后,世界机器人大会WRC 2024)又即将在北京拉开帷幕。再回到 5 月,在

JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升

JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升

9月19日,全球知名的软件开发工具提供商JetBrains在2024云栖大会上正式发布基于阿里云通义大模型的JetBrains AI Assistant,标志着JetBrains在完善其开发工具产品生

下注端到端:一场具身智能的谨慎豪赌

下注端到端:一场具身智能的谨慎豪赌

作者 | 赖文昕编辑 | 陈彩娴上个月末,世界机器人大会WRC 2024)在北京刚刚结束,27 款人形机器人果然成为了会场中的主角。夹爪叠衣服、做汉堡,灵巧手抓鸡蛋、演手舞,轮式进商超,双足满场逛..

创业板指涨逾1%,沪指站稳3500点上方

创业板指涨逾1%,沪指站稳3500点上方

来源:财联社财联社7月9日电,指数持续走强,创业板指拉升涨逾1%,沪指涨0.35%,深成指涨0.60%。影视传媒、核聚变、机器人、军工等方向涨幅居前,沪深京三市上涨个股近3100只。股市动态:09:3

家务机器人或将再更新?Chelsea Finn团队推出BID新算法,机器人一键变聪明

家务机器人或将再更新?Chelsea Finn团队推出BID新算法,机器人一键变聪明

斯坦福大学的 Chelsea Finn 团队又出新成果了。Chelsea Finn 团队一直是斯坦福走在具身智能研究前沿的团队之一,之前火遍全网的 ALOHA 炒菜机器人就是出自这个团队之手。团队领头

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT

2024年7月5日,上海——2024世界人工智能大会暨人工智能全球治理高级别会议WAIC 2024)战略合作伙伴商汤科技召开“大爱无疆·向新力”人工智能论坛,发布国内首个所见即所得模型“日日新5o”,

WAIC 2024 已落幕:大模型再无新玩家,AGI 下半场是计算与应用

WAIC 2024 已落幕:大模型再无新玩家,AGI 下半场是计算与应用

导语:「十八金刚」暗示的,其实是巨大的技术想象力与迫切的 AI 生产力。作者:马蕊蕾编辑:陈彩娴WAIC 论坛最后一天下午,启明创投主管合伙人周志峰在世博中心红厅分享了一组数据:经统计,仅 2023

通用3D机器视觉平台是不是伪命题?

通用3D机器视觉平台是不是伪命题?

机器视觉是工业制造向“智造”升级的重要一环。从技术发展的趋势看,工业机器视觉正在经历从2D到3D的蝶变。3D视觉的价值在于,多一维度的信息数据主要是空间坐标),能满足对体积、形状、距离等信息测量的需要

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践

以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?

在大模型革命的第一波浪潮中,许多初创公司和企业基于领先的闭源模型,如OpenAI的ChatGPT设计自己的商业模式。然而,随着越来越多新的开源模型的出现,大模型从训练转向推理,基于大模型的商业模式也在

与大模型交手近 1500 天,智源仍在坚持原始创新

与大模型交手近 1500 天,智源仍在坚持原始创新

2024 上半年, OpenAI 的成果从世界模拟器 Sora,到首个实现多模态 in 到多模态 out 的 GPT-4o ,仍在强势推进着迈向 AGI 的节奏。面对技术上的差距,追赶 OpenAI