SD-Eval新基准,让语音交互大模型情智兼备
随着GPT-4o、Moshi等模型的发布,语音交互大模型越来越受到大家的关注。如何全面的评价语音交互大模型的情商?最近港中大(深圳)联合字节跳动提出了SD-Eval,一个多维度评估语音对话理解和生成...
浅谈大模型的多模态和语音流式技术
ChatGPT 引爆LLM的同时scaling law席卷了整个机器学习行业,openai 、meta、google等公司在语音方向也分别推出了whisper、mms、audioPaLM多个语音大模型,在模型和数据规模上再次发挥scaling...
声学和韵律一致性的基于文本的语音编辑
本次分享由内蒙古大学计算机学院S2Lab实验室(https://ttslr.github.io)刘瑞研究员团队投稿在 InterSpeech 2024的论文《FLUENTEDITOR: TEXT-BASED SPEECH EDITING BY CONSIDERINGACOUSTIC AND ...
基于小批量预测修正的自监督说话人验证
论文题目:基于测小批量预测修正的自监督说话人验证作者列表:王钧旭,方志华,何亮单位:1.新疆大学计算机科学与技术学院 2.清华大学电子工程系 研究背景目前高性能的深度学习模型大多...
BERT-VITS2|哔哩哔哩UP主 冲浪普拉斯声音模型
模型仅技术测试,冲浪普拉斯是哔哩哔哩上一位知名的财经与商业领域UP主,拥有超过百万粉丝。冲浪普拉斯的视频内容主要聚焦于财经和商业领域,特别是商业史、商业案例分析以及经济现象的深度剖析...
GPT-SoVITS模型|成熟中年纪录片、成熟中年男声配音
浑厚大气,讲述自然 浑厚的中年男声,物超所值! 永久授权,本地离线模型GPT-SoVITS模型配音效果 鉴于GPT-SoVITS模型自回归特性,即其配音情绪高度依赖于所提供的参考音频,特此说明:...
GPT-SoVITS模型|人文纪实配音、纪实纪录片解说配音
人文纪实配音、纪实纪录片解说配音,永久授权,本地离线模型GPT-SoVITS模型配音效果 鉴于GPT-SoVITS模型自回归特性,即其配音情绪高度依赖于所提供的参考音频,特此说明:本视频所展示的配音...
GPT-SoVITS模型|御史配音模型,历史、电影真实情感配音模型
纪录片、电台、故事、悬疑推理、普通话、臻品达人、中年、男、臻品。每一句话都经过深思熟虑,犹如精准射出的箭矢,直中历史的要害。炼丹师永久会员288,全站配音模型免费下载,模型持续更新。...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。来源丨量子位谷歌Gemini Advanced付费版,同样的口径。新王Claude 3.5 Sonnet...















