英伟达推出 AI 语音识别模型 Parakeet,号称优于 Whisper
来源: 巴比特2024-01-08
据站长之家 1 月 8 日报道,开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。 英伟达宣布推出了四个 Parakeet 模型,这些模型基于 RNN Transducer/Connectionist Temporal Classification 解码器,并且具有 0.6-1.1 亿参数。它们能够应对各种音频环境,并且在仅使用了 64000 小时的数据集进行训练后,在基准数据集上实现了出色的词错误率(WER)表现,优于以往的模型。 根据开发人员的说法,这些模型对音乐和静音等非语音片段具有鲁棒性,并且在基准测试中优于 OpenAI 的 Whisper v3。它们还通过预先训练的控制点提供用户友好的集成到项目中。
热门新闻
- 1下周必关注|BounceBit将上线主网并空投代币;LayerZero将公布官方女巫检查结果(5.13-5.19)
- 2BounceBit主网已上线,推出节点质押和委托等多项新功能
- 3以太坊近期事件解析:香港加密ETF影响、美国ETH ETF前景、ETH是否会被认定为证券?
- 4特朗普“蹭”上加密圈:买4653美元NFT即可参与晚宴 相关MEME币飞涨
- 5Bitget研究院:加密市场全线反弹,Blast 6月26日确定空投
- 6全览FHE赛道:25个值得关注的项目
- 7特朗普和拜登,打响“加密大选”之战
- 8链游周报 | MATR1X阿波罗计划即将上线;超90%游戏代币下跌(5.6-5.12)
- 9Coinbase加密周报:市场或迎来拐点 Aave透露V4计划
交易平台最新公告查看更多>