亚马逊推出语音专用模型Nova Sonic
来源:李智衍 发布时间:2025-04-09
分享至微信

亚马逊近日发布了语音专用模型Nova Sonic,该模型结合了语音理解和语音生成两大功能,旨在推动客服中心自动化和AI代理应用的发展。据法新社报道,这一模型的推出将显著优化语音应用程序的开发流程。
语音模型已成为生成式AI领域的热点之一。目前,市场上不仅有支持通用任务的AI模型,还有专注于语音处理的模型。例如,OpenAI的ChatGPT具备语音模式,谷歌也推出了相关语音处理模型。在这一趋势下,如何提升手机智能语音助理和智能音箱的表现,成为行业关注的重要方向。
亚马逊在语音技术领域已有十多年的经验积累,其代表性产品包括智能语音助理Alexa,以及AWS云端平台上的Lex、Polly和Connect等对话和语音处理服务。然而,过去开发者在构建语音应用程序时,需要整合多个AI模型,如语音识别、语音转文字和文字转语音等。这种复杂的流程不仅增加了开发难度,还可能导致语音数据在多次转换中丢失原始说话者的声调、韵律和风格等细节。
为解决这些问题,Nova Sonic将语音理解和语音生成功能集成于一体,能够更准确地反映发话环境的特点,使对话更加自然流畅。亚马逊团队指出,人类对话的复杂性不仅体现在字义上,还体现在语调变化中,而语调的细微变化对AI来说一直是一个技术难点。
Nova Sonic可通过Amazon Bedrock开发平台的应用程序界面(API)使用,主要聚焦于客服电话自动化和AI代理两大应用场景。这些功能在旅游、教育、医疗保健和娱乐等领域有着广泛需求。此外,亚马逊的基础模型系列Amazon Nova已涵盖文字、影像和视频等多种生成功能,而Nova Sonic则是专为语音应用设计的最新成果。
除了自主研发的模型,亚马逊还与Anthropic、Meta等合作伙伴展开合作。在Meta近期发布Llama 4新模型后,亚马逊迅速宣布对其提供支持。
[ 新闻来源:李智衍,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

李智衍
开创IC领域,共创美好未来!
查看更多
相关文章
亚马逊开发推理模型Nova
2025-03-05
达梭携手Mistral,推动专用LxM模型发展
2025-02-27
OpenAI推出新一代语音合成模型,支持自然语言调控音色
2025-03-21
AMD推出开源Instella语言模型
2025-03-08
月之暗面推出新模型“kimi-latest”
2025-02-19
热门搜索
亚德诺(ADI),最新授权分销商名单
英飞凌收购Marvell汽车业务
关税
华为
台积电
中芯国际
联发科
高通
英特尔