SD-Eval新基准,让语音交互大模型情智兼备
随着GPT-4o、Moshi等模型的发布,语音交互大模型越来越受到大家的关注。如何全面的评价语音交互大模型的情商?最近港中大(深圳)联合字节跳动提出了SD-Eval,一个多维度评估语音对话理解和生成...
声学和韵律一致性的基于文本的语音编辑
本次分享由内蒙古大学计算机学院S2Lab实验室(https://ttslr.github.io)刘瑞研究员团队投稿在 InterSpeech 2024的论文《FLUENTEDITOR: TEXT-BASED SPEECH EDITING BY CONSIDERINGACOUSTIC AND ...
GPT-SoVITS模型|南南配音、有故事感的AI配音
影视、纪录片、普通话、臻品达人、男、臻品、小沧桑男。声音富有故事与沧桑感,听他讲的励志故事,肯定更有说服力。 炼丹师永久会员288,全站配音模型免费下载,模型持续更新。高级炼丹师免费...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。来源丨量子位谷歌Gemini Advanced付费版,同样的口径。新王Claude 3.5 Sonnet...
GPT-SoVITS模型|lin品质广告配音
高端广告女声 各类高质量广告、宣传片用GPT-SoVITS模型配音效果 鉴于GPT-SoVITS模型自回归特性,即其配音情绪高度依赖于所提供的参考音频,特此说明:本视频所展示的配音情绪仅为采用某一特...












