字节跳动推出Seeduplex大模型 全双工技术落地豆包App提升语音交互体验

   时间:2026-04-10 04:59 来源:快讯作者:上海证券报

字节跳动近日在语音交互领域迈出重要一步,正式发布原生全双工语音大模型Seeduplex。这款基于"边听边说"架构研发的语音系统,通过突破传统半双工模式的交互局限,实现了对话流畅度与自然度的显著提升,标志着全双工技术从实验室走向大规模商用阶段。

相较于前代豆包端到端语音模型采用的半双工模式,Seeduplex的创新性体现在同步处理输入输出信号的能力上。该模型通过优化神经网络架构,使系统能够在接收语音的同时即时生成响应,彻底改变了传统语音交互中"先听后说"的延迟模式。经实测,新系统在对话连贯性、语义理解准确率等核心指标上均有突破性进展。

目前该技术已全面集成至豆包App,为超过1亿用户提供实时语音服务。这项部署创造了行业先例——首次将实验室级别的全双工技术转化为亿级用户规模的商业应用。用户在使用过程中可体验到类似真人对话的交互效果,系统能自然处理打断、停顿等复杂场景,在车载导航、智能客服等场景具有广泛应用前景。

技术团队透露,Seeduplex的研发历时18个月,涉及声学建模、语言理解、多模态感知等多个领域的协同突破。其核心优势在于构建了端到端的语音处理管道,通过自监督学习框架显著提升了系统在噪声环境下的鲁棒性。随着5G网络的普及和边缘计算的发展,这类实时交互技术有望重塑人机沟通方式。

 
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  RSS订阅  |  违规举报 鲁公网安备37010202700497号