当前位置: 网站首页 > 数码配件 > 详情

chattahoochee(chattra)

2024-05-10 22:20:23 数码配件 0

强调:

车载语音智能的短板在于“语义理解”。在AI圈子里流行的ChatGPT,在车载语音智能方面有了显着的加入。

chattahoochee(chattra)

使用ChatGPT的主要问题是成本,包括使用成本、云服务成本和针对性培训成本。

云之声董事长兼CTO梁家恩向TechWeb表示,ChatGPT技术一定会在车辆、家庭等智能交互应用中有所建树,但需要结合应用场景进行优化。

Spichi汽车事业部产品总监葛富江告诉TechWeb,新技术的发展不可避免地会面临商业落地的挑战。人工智能技术创新必须与场景应用相结合。 ChatGPT在车辆上的应用将基于算力优化、云端智能融合技术。给其他方面带来挑战。

ChatGPT的流行突然蔓延到汽车领域。

众所周知,语音交互是车内最简单、最人性化、最安全的交互方式,也是未来最重要的车内交互方式。随着AI和硬件性能的增强,语音交互是未来汽车的绝对主流。语音交互主要是车载自然语音识别和语音助手,也可以简单地说是NLP和NLU技术。既然是NLP,那就应该是最近在AI圈子里火起来的ChatGPT发挥作用的地方了。这是真的吗?

车载语音智能化,短板在“智能”

从技术角度来看,智能语音交互主要有三个重点,即识别、理解和执行。目前提供解决方案的厂家中,识别部分已经比较成熟,识别率可以达到90%以上,有的识别率已经达到95%左右。行业的痛点主要集中在“理解”部分。大多数车载语音交互系统在“理解”上并不智能,导致整个系统功能单一、命令字单一。

那么问题来了,如何让车载语音交互系统像人类一样听懂我们的话呢?

这就涉及到NLP(自然语言处理)技术。它们对用户输入语音的理解离不开自身的场景策略和多轮对话,直接决定了车载语音交互系统的智能程度。说到NLP,最近非常流行的ChatGPT正是ChatGPT正在尝试做的事情。

从历史上看,NLP的发展有过几个关键节点,其中最重要的两个节点无疑是2012年和2018年。

2012年,深度学习开始在NLP领域应用; 2018年开始,以Google BERT为代表的语义表示预训练取得巨大突破,横扫各大NLP任务基准; 2020年5月,OpenAI投入巨资构建GPT-3,一经发布就引起了业界的轰动。该版本模型拥有1750亿个参数,被称为NLP领域最强的AI模型。

最近流行的ChatGPT是基于大规模预训练的语言模型(GPT-3.5)。凭借其强大的语言理解和生成能力,它通过手动注释和反馈对大规模数据进行学习,从而使预训练的语言模型能够更好地理解人类的问题并给出更好的回答。

Spichi汽车事业部产品总监葛富江告诉TechWeb,ChatGPT目前以文本交互机器人的形式呈现,适用于多种文本处理任务,常用于智能问答、对话等领域和文本创建;车载语音基于对话交互。主要是用来执行有明确指示的动作,比如“导航到XXX?打开音乐”。 “语音助手”采用高度拟人化的语音输出,响应车主的需求。通过车载语音交互,解放驾驶员的双手,集中注意力,带来更安全、更便捷的驾驶体验。未来,随着ChatGPT技术在汽车上的应用,将不仅仅是完成固定指令的基于任务的对话,汽车和人将能够更高效、更直接、高度灵活地沟通关于出行、知识、聊天;

“ChatGPT”的火爆让市场看到了认知智能应用的潜力。 ChatGPT在推理和学习能力方面具有明显优势。它不仅可以用于理解和对话,还可以通过情境交流和自学习来实现辅助创造和知识进化。这些能力也适用于车载语音交互领域,融合对话智能技术、深度学习大模型技术、工程能力以及大数据的潜力,带来更流畅、更有效的响应。在车内有限的空间内,结合声场定位和多说话人判断,提高多人物、长上下文对话的逻辑一致性;还可以扩展满足方言、外语的统一识别和对话需求,快速实现更加灵活、自由、个性化的交互。 ”葛富江说道。

从目前ChatGPT(包括我们自己)的使用来看,我们认为在车载智能语音的NLP方面,它应该是最好的、最聪明的。这是否意味着短期内肯定会应用于车载智能语音系统?

市场空间有限,产业链、市场挑战犹存

众所周知,一项新技术或产品最终能否大规模落地应用,除技术因素外,还与其所在行业或市场的产业链、市场实力密切相关。竞争、市场空间。

具体到车载智能语音系统,虽然ChatGPT在“智能”方面表现不错,但在整个产业链中属于较晚的,需要依赖很长的前端链条,比如信号处理、语音识别、并在使用之前输出文本。为此,前端链条中的因素会对后端流程产生影响。例如,信号处理会影响语音识别。如果语音识别出现问题,就会影响NLP的判断。链条中的每个模块都需要提高可靠性,以确保最终能够脱颖而出。总体结果是可靠的。这意味着ChatGPT“智能”能力的输出并不完全取决于自身的能力。其产业链中的任何一个环节都会对其产生积极或消极的影响。

云之声董事长兼CTO梁家恩向TechWeb表示,ChatGPT技术一定会在车辆、家庭等智能交互应用中有所建树,但需要结合应用场景进行针对性优化,以提升体验、降低服务成本。

“在车辆等智能交互应用场景中,体验升级的空间很大,但目前ChatGPT是一个非常大的模型,如何在保持体验的同时大幅降低服务成本是一个关键问题。”

从市场竞争强度来看,根据相关统计,目前汽车语音系统市场除了被在该领域拥有多年产品和合作经验的科大讯飞和赛伦斯垄断外,还存在众多不同规模的企业。参与。其中,更为重要的是,当前车载语音市场已经遇到了增长天花板。这使得竞争变得激烈,甚至科大讯飞和Cerence也开始在车内使用除语音之外的多模态交互。云服务融合等服务路线,以综合实力提升竞争力。作为后来者,ChatGPT一旦决定进军车载智能语音市场,必然会面临强大对手的挑战。

葛富江补充道,从成本角度来看,ChatGPT的研究需要巨大的资金和人才投入,需要超算平台、算法、数据等核心优势的支撑。这些都是成本。巨型平台公司目前在这方面具有优势。对于科技公司来说,可以更多地从场景融合入手,寻求创新机会。

从商业化场景来看,chatGPT目前更适合基于一定背景知识的创意产业,以及需要AIGC和SOP(标准操作流程)行业的场景,例如智能写作、智能客服、文档管理、代码一代,甚至游戏。 NPC等

板梦农旭经理孙永杰指出,从纯汽车语音市场来看,其市场空间并不大,这一点从垄断该市场的科大讯飞和赛伦斯的财报就可以看出。在这种情况下,能否吸引成本高昂的ChatGPT进入仍是未知数。毕竟ChatGPT训练成本高昂,而其所属的Open AI目前还在亏损。

未来仍可期,合作和开放 API 或是更好选择

如上所述,ChatGPT仅在车载智能语音的NLP方面具有优势。虽然ChatGPT据说也在语音识别和合成方面进行AI训练,希望未来进军车载智能语音市场。但考虑到ChatGPT只是一种文本交互方式,即使用于语音识别和合成的AI训练,最终的效果又如何呢?能否超越目前市场上已有并已应用的车载智能语音系统,目前还是未知数。

当然,鉴于ChatGPT的强大能力,TechWeb认为,未来的市场空间将随着智能汽车应用场景的不断拓展而不断扩大,ChatGPT找到其真正的用武之地也并非不可能。更值得期待的是,除了智能汽车本身,从整个汽车行业来看,其未来在汽车设计、制造等领域的应用都充满想象空间。

葛富江表示:“目前尚不清楚ChatGPT在车辆上的应用将如何发展。可以预见的是,在车辆场景中,大模型技术学习能力具有明显优势。通过强化上下文理解能力、思维链推理、增强指令学习,实现持续学习,达到“回答类似问题”的效果。除了指令要求之外,日常知识和聊天对话都可以更加流畅和有用。总体来说,技术将朝着统一的多模态交互方向发展,强化语音、文字、图像等深度融合的多模态交互技术,形成“汽车大脑”,满足车内、公共空间等复杂场景的交互需求。”

小鹏汽车技术团队告诉TechWeb,ChatGPT拥有强大的语言组织能力和相对庞大的知识库,涵盖更广泛的领域,因此可能会给用户带来更好、更智能的体验。至于以后是否应该引入这个技术接口,或者做类似技术的集成开发,我们也在进一步探索中~

基于此,TechWeb认为,合作应该是ChatGPT进入车载智能语音市场最经济有效的方式。这是各取所长的原则。实际情况是,国内极度汽车近日宣布将整合百度文心一言的综合能力,打造全球首个面向智能汽车场景的大规模人工智能交互体验,证明了这一模式的可行性。

另外,通过API将自己最好的能力开放给第三方,只导出自己最好的能力,也是一个明智的选择。