来源:杏彩体育官网app 发布时间:2025-06-18 16:47:48
在人工智能应用方面,信任的重要性远超技术实力。图片来自:getty images
我们评估人工智能的方法存在一种吊诡的错位:我们创造出模仿和强化人类能力的系统,然而衡量其成功的标准却包罗万象,唯独遗漏了那些真正对人类而言有价值的维度。
科技行业的数据展示界面上满是有关人工智能的亮眼数字:处理速度、参数数量、基准测试得分、用户增长率。硅谷最顶尖的人才不断调整算法,只为拉高这些指标。然而,在这一堆衡量标准中,我们却忽视了一个基本事实:世界上最先进的人工智能,若无法实实在在地改善人类生活,便毫无价值可言。
想想早期搜索引擎的故事。在谷歌崭露头角之前,各大公司围绕网页索引数量展开激烈竞争。然而谷歌之所以能够异军突起,并非因为它拥有顶级规模的数据库,而在于它更深刻地洞察了用户行为——相关性和可信度比单纯的数量更重要。
当下的AI领域,情形与往昔有着异曲同工之处。各公司竞相构建规模更大的模型,却可能忽视了以用户为核心的设计里那些更微妙的元素,而这些元素才是真正推动AI应用和发挥影响力的关键所在。
改善人工智能评估体系的重点是建立信任机制。最新研究成果显示,那些能够清晰阐释自身推理过程的AI系统(即便存在偶发误差)能赢得用户更深度的持续使用。这其中的道理通俗易懂——无论是面对技术还是人际交往,信任的基石都在于透明度和可靠性,而非单纯的性能指标。
然而,信任只是基础。最有效的AI系统通过展现对人类心理的真正洞察,与用户建立起真正的情感联系。研究揭示出一种极具说服力的模式:当AI系统不再局限于执行任务,而是可根据用户的心理诉求做调整时,它们就会成为人类日常生活中不可或缺的一部分。这绝非简单地编写几句看似友好的程序,而是要打造出真正理解并能回应人类体验的系统。
于人工智能的应用场景而言,信任的重要性远超技术实力。一项针对近1100名消费者展开的、具有开创性意义的人工智能聊天机器人研究揭示:人们在面对服务失误时,是否愿意选择谅解并保持对品牌的忠诚度,并不取决于人工智能处理问题的快慢,而在于他们是否信任这个试图提供帮助的系统。
研究人员发现,构建这种信任关系需满足三个至关重要的维度:其一,人工智能需展现出真正理解问题以及处理问题的能力;其二,它需流露出善意,即真诚地希望为用户更好的提供帮助;其三,它需在与用户的互动过程中,始终如一地保持诚实,以此维系自身的诚信形象。当人工智能聊天机器人具备这些特质时,客户便更倾向于原谅服务中出现的问题,也不太可能向他人抱怨自己的体验。
如何让人工智能系统赢得用户的信赖呢?研究之后发现,一些简单的举措就能带来显著效果:为AI赋予拟人化的特质,通过编程使其在回复中展现出同理心(“我理解这一定让你很沮丧”),以及在数据隐私方面保持透明。有这样一个典型案例,一位遭遇送货延迟问题的客户,在与名为罗素的聊天机器人沟通时,罗素不仅认可了客户的沮丧情绪,还条理清晰地解释了问题产生的原因以及解决方案,客户对罗素这样的聊天机器人更有可能保持忠诚度(与只是单纯陈述事实、连名字都没有的聊天机器人相比)。
这一发现冲击了“人工智能只需做到快速准确”的普遍假设。在医疗保健、金融服务以及客户支持领域,那些最为成功的生成式AI系统,并非一定是架构最为复杂的,而是那些能够与用户建立起真正融洽关系的系统。它们愿意花费时间向用户阐释推理过程,承认用户心中的顾虑,并且始终如一地使用户得到满足需求。
然而,传统衡量标准并不总能反映出这些关键的性能维度。我们应该构建新型评估框架:在评估AI系统时,不能仅仅局限于技术娴熟程度,还需关注系统营造心理安全感、与用户建立起真正融洽关系的能力,而最为关键的是,要看它们能否助力用户达成目标。
在Cleo公司,我们致力于借助人工智能助手来提升人们的财务健康水平,当下正探索全新的衡量标准。这可能意味着要衡量用户信任度、用户参与深度和质量等因素,同时,我们还会关注整个对话过程。对我们而言,了解公司的人工智能财务助手Cleo能否在每次交互中帮助用户达成目标至关重要。
构建更为细致的评估框架,并不代表要舍弃性能指标,毕竟性能指标仍是衡量商业与技术成功的重要指标。只不过,它们需要与那些能够更深入衡量对人类产生影响的指标相互平衡。但这绝非易事,其中一个挑战在于这些指标存在主观性,不同个体对于“好”的评判标准往往大相径庭。即便如此,这些指标仍然值得探索。
随着人工智能越来越深入地融入日常生活,能够理解这种转变的公司才会取得成功。过往引领我们至今的评估标准,已然不足以满足未来发展的需求。是时间开始衡量真正关键的要素了:咱们不可以仅仅聚焦于人工智能的性能表现,更应关注它究竟能在多大程度上助力人类实现蓬勃发展。
费尔南达·多巴尔(Fernanda Dobal)现任Cleo公司产品总监,主要负责公司的A与聊天机器人相关业务。
我们评估人工智能的方法存在一种吊诡的错位:我们创造出模仿和强化人类能力的系统,然而衡量其成功的标准却包罗万象,唯独遗漏了那些真正对人类而言有价值的维度。
科技行业的数据展示界面上满是有关人工智能的亮眼数字:处理速度、参数数量、基准测试得分、用户增长率。硅谷最顶尖的人才不断调整算法,只为拉高这些指标。然而,在这一堆衡量标准中,我们却忽视了一个基本事实:世界上最先进的人工智能,若无法实实在在地改善人类生活,便毫无价值可言。
想想早期搜索引擎的故事。在谷歌崭露头角之前,各大公司围绕网页索引数量展开激烈竞争。然而谷歌之所以能够异军突起,并非因为它拥有顶级规模的数据库,而在于它更深刻地洞察了用户行为——相关性和可信度比单纯的数量更重要。
当下的AI领域,情形与往昔有着异曲同工之处。各公司竞相构建规模更大的模型,却可能忽视了以用户为核心的设计里那些更微妙的元素,而这些元素才是真正推动AI应用和发挥影响力的关键所在。
改善人工智能评估体系的重点是建立信任机制。最新研究成果显示,那些能够清晰阐释自身推理过程的AI系统(即便存在偶发误差)能赢得用户更深度的持续使用。这其中的道理通俗易懂——无论是面对技术还是人际交往,信任的基石都在于透明度和可靠性,而非单纯的性能指标。
然而,信任只是基础。最有效的AI系统通过展现对人类心理的真正洞察,与用户建立起真正的情感联系。研究揭示出一种极具说服力的模式:当AI系统不再局限于执行任务,而是可根据用户的心理诉求做调整时,它们就会成为人类日常生活中不可或缺的一部分。这绝非简单地编写几句看似友好的程序,而是要打造出真正理解并能回应人类体验的系统。
于人工智能的应用场景而言,信任的重要性远超技术实力。一项针对近1100名消费者展开的、具有开创性意义的人工智能聊天机器人研究揭示:人们在面对服务失误时,是否愿意选择谅解并保持对品牌的忠诚度,并不取决于人工智能处理问题的快慢,而在于他们是否信任这个试图提供帮助的系统。
研究人员发现,构建这种信任关系需满足三个至关重要的维度:其一,人工智能需展现出真正理解问题以及处理问题的能力;其二,它需流露出善意,即真诚地希望为用户更好的提供帮助;其三,它需在与用户的互动过程中,始终如一地保持诚实,以此维系自身的诚信形象。当人工智能聊天机器人具备这些特质时,客户便更倾向于原谅服务中出现的问题,也不太可能向他人抱怨自己的体验。
如何让人工智能系统赢得用户的信赖呢?研究之后发现,一些简单的举措就能带来显著效果:为AI赋予拟人化的特质,通过编程使其在回复中展现出同理心(“我理解这一定让你很沮丧”),以及在数据隐私方面保持透明。有这样一个典型案例,一位遭遇送货延迟问题的客户,在与名为罗素的聊天机器人沟通时,罗素不仅认可了客户的沮丧情绪,还条理清晰地解释了问题产生的原因以及解决方案,客户对罗素这样的聊天机器人更有可能保持忠诚度(与只是单纯陈述事实、连名字都没有的聊天机器人相比)。
这一发现冲击了“人工智能只需做到快速准确”的普遍假设。在医疗保健、金融服务以及客户支持领域,那些最为成功的生成式AI系统,并非一定是架构最为复杂的,而是那些能够与用户建立起真正融洽关系的系统。它们愿意花费时间向用户阐释推理过程,承认用户心中的顾虑,并且始终如一地使用户得到满足需求。
然而,传统衡量标准并不总能反映出这些关键的性能维度。我们应该构建新型评估框架:在评估AI系统时,不能仅仅局限于技术娴熟程度,还需关注系统营造心理安全感、与用户建立起真正融洽关系的能力,而最为关键的是,要看它们能否助力用户达成目标。
在Cleo公司,我们致力于借助人工智能助手来提升人们的财务健康水平,当下正探索全新的衡量标准。这可能意味着要衡量用户信任度、用户参与深度和质量等因素,同时,我们还会关注整个对话过程。对我们而言,了解公司的人工智能财务助手Cleo能否在每次交互中帮助用户达成目标至关重要。
构建更为细致的评估框架,并不代表要舍弃性能指标,毕竟性能指标仍是衡量商业与技术成功的重要指标。只不过,它们需要与那些能够更深入衡量对人类产生影响的指标相互平衡。但这绝非易事,其中一个挑战在于这些指标存在主观性,不同个体对于“好”的评判标准往往大相径庭。即便如此,这些指标仍然值得探索。
随着人工智能越来越深入地融入日常生活,能够理解这种转变的公司才会取得成功。过往引领我们至今的评估标准,已然不足以满足未来发展的需求。是时间开始衡量真正关键的要素了:咱们不可以仅仅聚焦于人工智能的性能表现,更应关注它究竟能在多大程度上助力人类实现蓬勃发展。
费尔南达·多巴尔(Fernanda Dobal)现任Cleo公司产品总监,主要负责公司的A与聊天机器人相关业务。