评论
分享

“精准学”官宣将公布中国首个语音端到端大模型

TMT星球

2024-08-23 18:22 广东

43395 0 0

教育科技公司“精准学”宣布,公司已在AI语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”,可直接实现语音输入-语音输出的交互,使其更适配辅学场景,使大模型达到“真人老师”级别的自然对话交流体验。

“心流知镜-s(V02)” 使用端到端语音结构,避免了级联ASR+LLM+TTS方式额外延迟,同时也更好的改善纯文本模型损失的情感节奏等丰富信息,接近人类的语音交互体验。

精准学也提供时间表开放基础模型供学术和非商用使用,致力于为中文 AI社区的科研和技术探索作出贡献。

“心流知镜-s(V02)”的发布,不仅将在高质量中文语音Codec 和中文自监督预训练Encoder 基础设施上填补中文开源社区的空白,还将在全球范围内成为首个开放给技术社区的语音端到端大模型。

据「TMT星球」了解,精准学将于近期对外展示这项技术的应用成果。5月,公司获得了阿里2亿元投资,目前其AI辅学机Bong系列已在天猫京东上线。不久后用户也可以在精准学AI辅学机上体验到这项技术突破成果。

# 精准学
# 大模型
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读