chatGPT与传统搜索结合创建新一代搜索引擎
作者:点火三周 发布时间:2022-06-15 18:54:27
不到40天,ChatGPT的日活量已突破千万!而当年同样引起轰动的Instagram达到这一成就足足花了355天。
这代表着我们正在广泛且快速地接受被chatGPT重新定义的知识查询与获取的方式。
而这个需求在过去的20年中,是由类似google,baidu这样的搜索引擎所定义和满足的。现在,范式革 命正在出现。这也是为什么google对于chatGPT与微软走得很近,如此紧张的原因。
因为chatGPT与必应的结合,必然会带来一场新的革 命,甚至可能是颠覆式的。本文将尝试讨论如何构建基于人工智能语言理解和AIGC的搜索引擎的可能,来提前一窥未来。
为什么我们会更接受chatGPT的模式
我们可以先从传统搜索引擎来看,我们是怎么进行交互的。
我们在搜索框中输入我们想要查询或者感兴趣的关键字,或者描述。
而后搜索引擎在搜索时的工作步骤大致如下:
接收用户的查询请求
利用索引(Index)来快速定位包含关键字的网页
排序和排名(Ranking),使用各种因素(如网页内容、链接等)来决定搜索结果的排列顺序
返回排名最高的搜索结果给用户
需要筛选的列表
在没有chatGPT之前,我们大多数时候是非常满足这种一次性的交互的。我们可以通过多次独立的搜索最终获取我们需要的答案。
但chatGPT出现之后,游戏的方式被改变了。它解决的主要问题在于:
自然语言处理能力强:chatGPT可以理解自然语言查询,并回答相关问题,而搜索引擎通常只能处理简单的关键词查询。
上下文认知能力:chatGPT可以根据用户提供的上下文信息来理解查询并回答问题,搜索引擎通常只针对单次查询进行回答。
交互性强:chatGPT可以进行更加深度的交互和延展交互,而搜索引擎通常只返回一组搜索结果。
更好的用户体验:chatGPT可以生成易于理解的结果,而搜索引擎返回的结果通常是一些网页链接,需要用户自己去浏览。
这样,无论是从知识获取的效率,还是深度交互和延展上,我们都获得了极大的满足和提升。
更接近人类交互的方式:明确、直接
我们不再需要筛选结果,不需要点击网页等待跳转,不再需要分割多次查询,可以直接延伸交互,甚至是可以纠错。形象点的描述,搜索引擎更像是一本高效实时的字典,而chatGPT更像是一个知识渊博的老师,能跟你交流,告诉你想要知道的知识,虽然它可能犯错。但一样的,搜索引擎也可能犯错,毕竟有 * 的SEO的存在,或者本身就是包含了错误内容的答案。
chatGPT相对于搜索引擎的不足之处
我们提到的可能的范式革 命的出现,并不是用chatGPT这样的聊天机器人直接取代搜索引擎。因为chatGPT并不能取代搜索引擎,ChatGPT是一个大型语言模型,它相对于搜索引擎有以下不足之处:
准确性:尽管ChatGPT已经被训练了大量的数据,具有很高的回答率,但它仍然存在错误和误导信息的可能。(但搜索引擎同样存在错误和误导)
数据更新:ChatGPT在训练时截止到2021年
知识范围:ChatGPT的知识是有限的,没有搜索引擎的知识库那么丰富
生成速度:与搜索引擎相比,生成结果的速度可能更慢,因为需要计算和生成结果
推理能力:搜索引擎可以根据查询词进行关键字匹配,但ChatGPT不具备这样的推理能力
但正如最开始提到的,ChatGPT的模式正在被广泛且快速的接受,因为它弥补了传统搜索引擎在理解和交互上的不足,一旦我们适应了新的事物,陈旧与低效的方式总会被替代,就如电子相机替代机械相机,因为我们可以美图,可以交互。
chatGPT与传统搜索引擎结合
正如Keras之父所说,“搜索与生成根本就是两个问题,原理上就决定了两者无法相互取代。”我们要做不是用chatGPT
取代搜索引擎,Keras之父没有说完的是:生成式AI和搜索引擎是互补关系,我们需要的是结合两者优势的新一代工具。
这种新型搜索引擎将利用chatGPT等生成式AI负责交互的部分:利用chatGPT的语言理解能力来更好地理解用户的查询,也将利用chatGPT的生成能力,给我们组织更明确和直接的内容,并记录上下文,开展更有深度和延展性的交互。
而搜索引擎将隐藏在交互接口的背后,并使用传统搜索引擎的索引和排名算法来为AI提供补充和校准。
这种结合将帮助提高搜索体验和满足用户的查询需求。
其具体工作原理可以如下:
查询解释:使用chatGPT或类似的语言模型来解释查询的意图(包括是否是包含上下文的互动式交互),判断是否是chatGPT无法回答的问题或是否是最新信息的检索。
搜索结果获取:当查询是chatGPT无法回答的问题时,使用传统搜索引擎来获取最相关的网页。
搜索结果理解:使用chatGPT或类似的语言模型来理解搜索结果并生成易于理解的结果。
结果生成模块:将语言理解和排名的结果结合生成最终的搜索结果,并记录上下文
这种方式能够更好地理解用户的查询意图,并为用户提供更准确的搜索结果,提高搜索体验。
同时,可以在界面上明确的告知结果生成的过程,并包含搜索引擎介入时的相关网页链接。当用户认为结果并不准确,或并非最新的结果时,可以反馈,以帮助AI增强学习。
架构示意图如下:
架构示意图
因此,交互会看起来像这样,当交互搜索引擎无法直接回答时,将给客户提供网页链接,并根据预处理模型的理解,以及客户反馈,通过增强学习来强化AI模型的能力,学习新的知识。
期望中的交互搜索
来源:https://cloud.tencent.com/developer/article/2211660?areaSource=&traceId=


猜你喜欢
- 如果你搞过ASP的开发,你就会为ASP中没有好的完整的调试环境而头疼不己。我收集了网上相关所有信息提示,想给它做成单机的ASP开发错误提示软
- function isWindow( obj ) { if( typeof obj.closed == 'undefined'
- Macromedia StandardMacromedia Dreamweaver MXMenu Commandsphotoshop快捷键大
- 如下所示:# the basic ways = 0for x in range(10): s += x# the right ways =
- 给图像添加颜色在使用OpenCV操作图像时,有时候需要给图像添加不同的颜色,以达到不同的风格效果。这里介绍的主要是opencv中的cv.ap
- 软件版本Python 2.7.13; Win 10场景描述1、使用python读取指定长度的文本;2、使用python读取某一范围内的文本。
- 那天突然的一个灵感,是针对防盗链的。正常上传的文件,若被人盗链则增加了自己服务器的负担,上次164.cc就因此被挂。然后想想对策,目前各类防
- 概述 -------------------------------------------------------------------
- 本文实例讲述了Python运算符重载用法。分享给大家供大家参考。具体如下:在Python语言中提供了类似于C++的运算符重在功能:一下为Py
- 在以前的MySQL版本中是没有窗口函数的,直到MySQL8.0才引入了窗口函数。窗口函数是对查询中的每一条记录执行一个计算,并且这个计算结果
- CONSTRAINT约束,即对数据库表中的数据进行约束,以保证数据记录的完整性和有效性。比较常用的是,创建表时添加约束,但是为了整理记录,这
- 第一步:创建一个表。 create table Test_Table ( ID number(11) primary key, Name v
- 一、MySQL 逻辑架构概览MySQL 最重要、最与众不同的特性就是它的可插拔存储引擎架构(pluggable storage engine
- 首先交代一下运行环境和工具版本:WIN10MINGW64ORACLEINSTANCCLIENT_18_3 x64Jetbrins Golan
- 前言最近参加了datawhale的组队学习活动,在组队学习动员下,开始通过强迫自己输出来实现更好的输入与处理,6-15开始自己的第一次文章发
- 一、方框滤波 方框滤波是均值滤波的一种形式。在均值滤波中,滤波结果的像素值是任意一个点的邻域平均值,等于各邻域像素值之和的均值,而在方框
- 实例如下所示:from tensorflow.python import pywrap_tensorflowcheckpoint_path
- 查询速度慢的原因很多,常见如下几种: 1、没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) 2、I/O吞吐量小,形成了瓶
- 在使用Python的过程中难免会遇到不同的项目使用不通同的Python环境,这就引出Python环境的切换问题这篇文章以3.11.0与3.1
- 这篇文章主要介绍了Django rstful登陆认证并检查session是否过期代码实例,下面我们可以来一起学习一下。一:restful用户