NVIDIA Riva

构建和部署完全可自定义的语音 AI 应用。

NVIDIA Riva

构建和部署完全可自定义的语音 AI 应用。

适用于各行各业的语音 AI 技能。

 语音 AI 技能,即自动语音识别 (ASR) 和文本转语音 (TTS),可转变企业与各行各业客户交互的方式和提供支持的方式。NVIDIA® Riva 是 NVIDIA AI 平台的一部分,提供先进的 GPU 优化工作流,用于为应用(例如联系中心代理协助、虚拟助手、数字虚拟形象、品牌语音和视频会议转录)构建和部署完全可自定义的实时 AI 流程。借助 Riva,您可以根据用例调整应用,并在所有云、数据中心、边缘或嵌入式设备上进行部署。

了解出色的语音 AI 如何实际应用。

  • 语音转文本
  • 文本转语音

试用 NVIDIA Riva 自动语音识别。

在此演示中,Riva ASR 实时提供高度准确的转录。

您可以通过麦克风进行录入,也可以从设备上传 .wav 格式的文件。

每个样本的持续时间限制为 30 秒。

试着说点什么

试用 NVIDIA Riva 文本转语音功能。

如果您想为交互式虚拟助手、现代家用设备或者阅读障碍人士或视觉障碍人士的阅读助手添加语音,请尝试 Riva 开箱即用 (OOTB) 的英文女性或男性语音。

聆听使用 Riva 先进 (SOTA) 的神经语音合成模型创建的逼真且富有表现力的语音。

0/400

在使用 Riva 语音识别和 Riva 文本转语音时,您需遵从我们的使用条款。您的数据将用于改进 NVIDIA 的产品和服务。

NVIDIA Riva 是什么?

适用于语音 AI 应用的简单端到端工作流。

Riva 提供:

  • 预训练语音 AI SOTA 模型:ASR 和 TTS 模型可根据数据集完全自定义,将特定领域专用模型的开发速度提高 10 倍。

  • 高性能推理:推理由 NVIDIA TensorRT™ 优化提供动力支持,并使用 NVIDIA Triton™ 推理服务器提供服务,而两者都是 NVIDIA AI 平台的组成部分。

  • Riva 服务:这些服务可作为基于 gRPC 的微服务提供,用于低延迟串流,以及高吞吐量的离线用例。

  • 高可扩展性:Riva 已完全容器化,可以轻松扩展到数百和数千个并行流。
端到端语音 AI 工作流

探索 NVIDIA Riva 的优势。

开箱即用的精度

高准确性。

提供先进的预训练模型,这些模型已在 NVIDIA 超级计算机上经过数千小时的音频训练。

灵活自定义

完全可自定义。

提供可根据您的用例、行业和领域微调的开箱即用模型和灵活流程。

可扩展的部署

在任何位置大规模运行。

支持在云端、数据中心和边缘扩展到数十万名并发用户。

实时性能

实时性能。

通过利用 NVIDIA TensorRT 实现的强大 NVIDIA AI 优化,获得远低于 300 毫秒阈值的实时性能。

企业级支持

企业级支持。

确保语音 AI 服务具有更短的宕机时间和更高的系统利用率。

开始使用 NVIDIA Riva。

您可以通过 NVIDIA AI Enterprise 软件获得 Riva 支持,也可以免费下载容器和预训练模型。

付费企业级支持

借助 NVIDIA AI Enterprise 软件,您可以通过 NVIDIA 企业级支持获得针对 Riva 大规模部署的支持。

其中包括:

  • 广泛平台支持,包括针对多种部署方案(Bare Metal、虚拟化、容器化以及公有云)的全面企业级支持。
  • 与 NVIDIA AI 专家(包括工程人员)联系,以获取配置和性能方面的指导。专家的服务时间为当地工作时间上午 8:00 至下午 5:00。
  • 优先接收关于近期安全修复和维护版本的重要通知。
  • 参加有讲师指导的研讨会以及自定进度培训。

免费容器和模型

NVIDIA Riva 可免费作为一组容器和预训练模型供 NVIDIA NGCNVIDIA 开发者计划的成员等使用。

其中包括:

  • 访问开发者论坛,在论坛中您可以浏览关于方式的问题和最佳实践。
  • ASR 和 TTS 资源,包括教程、示例应用、Notebook 和文档。
  • 用于在数据中心(本地 Docker 或 Kubernetes)或嵌入式设备(本地 Docker)中部署 Riva 预训练模型、运行示例客户端以及自定义模型的指南

详细了解 Riva ASR。

语音识别技术支持互联网语音搜索、免手动计算、智能家居设备和车载助手的语音命令、医疗笔记、联系中心全天候虚拟助手,以及用于模式和趋势分析的电话和视频会议转录。NVIDIA Riva 自动语音识别 (ASR) 基于 GPU 优化模型提供出色、准确的转录,可针对任何领域或部署平台完全自定义。

Riva ASR 的主要特性包括:

  • 支持英语、西班牙语、普通话、印地语、俄语、德语和法语
  • 开箱即用型模型,这些模型在 NVIDIA GPU 上使用各种领域特定数据训练了数十万小时
  • 微调词汇、词典、声学、语言、标点符号和反向文本标准化模型,尽可能提高不同语言、口音、领域、词汇和上下文的准确性
  • 能够使用自动标点符号和出色时间戳返回串流转录,实现数十万输入音频流
  • 词语/粗俗语过滤,具备可自定义的有效冒犯性用语删除功能

详细了解 Riva TTS。

文本转语音会生成电子书和文档的叙述语音,作为智能助手或数字虚拟形象与人类交流,并且几乎是智能手机、平板电脑和笔记本电脑等所有数字设备的一部分。NVIDIA Riva 文本转语音 (TTS) 基于先进的频谱图生成和声码器模型提供逼真的合成语音。TTS 流程可自定义并且经过 GPU 优化,可高效实时运行。

Riva TTS 的主要特性包括:

  • SOTA 模型,用于生成富有表现力的逼真语音
  • 两种开箱即用的专业女性和男性语音(适用于美式英语)
  • 通过音高、音量和持续时间控制轻松进行语音和口音微调,以实现表现力
  • 推理性能比现有技术高 12 倍

借助 NVIDIA LaunchPad 快速开启您的 Riva 之旅

通过精心策划的免费实验立即使用 NVIDIA Riva。通过即用型软件、样本数据和应用,访问面向语音 AI 的分步引导式实验。

详细了解 Riva 嵌入式功能。

Riva 嵌入式功能在设备上为对话式应用提供实时、可靠且出色的准确转录和富有表现力的逼真语音,例如送货机器人、智能无接触操作台、自动售货机,以及适用于工厂、购物、医疗和智能家居设备的虚拟助手。

Riva 嵌入式功能的主要特性包括:

  • SOTA、开箱即用的 ASR 准确性,提供完整的设备外自定义,适用于英语、西班牙语、普通话、印地语、俄语、德语和法语
  • 富有表现力的 OOTB 型专业女性和男性英语语音,可立即在设备上部署并能创建全新品牌语音
  • 通过紧凑的设备计算和内存实现轻松集成和可靠的实时工作站性能
  • 通过设备上的语音数据处理实现较高的隐私性
  • 可在 NVIDIA Jetson AGX Xavier、Jetson Xavier NX、Jetson AGX Orin 和 Jetson Orin NX 上部署

AI 与元宇宙
时代的
开发者大会

诚邀您参加今年 9 月的 GTC 大会,激发您的下一个奇妙构想。请勿错过本次机会,您将听取各领域的专家和领导者介绍 AI 如何引发行业变革并给世界带来深远影响。9 月 19-22 日,我们线上不见不散。

 

及时了解近期活动和新闻。

语音 AI 峰会

由 NVIDIA 主办的免费线上活动。

NVIDIA 首次年度语音 AI 峰会将于 2022 年 11 月 3 日凌晨 0:00 至 5:00(北京时间)举行。  加入我们,与来自 Google、Meta、NVIDIA 等公司的专家就自动语音识别 (ASR) 和文本转语音 (TTS) 技术的趋势和技术进行深入的在线对话。

NVIDIA 语音 AI 峰会

NVIDIA Riva 为完全可自定义的语音 AI 设定新标准

在 GTC 上,NVIDIA 宣布了 NVIDIA Riva 的新增功能,包括针对印地语和法语提供出色的自动语音识别技术。Riva 还对英语、西班牙语、俄语、德语和普通话的准确性进行了优化。

NVIDIA Riva 为完全可自定义的语音 AI 设定新标准

了解性能基准。

NVIDIA Riva 性能基准测试

阅读客户案例。

NCS 客户案例

NCS 在 Breeze(驾驶员的配套应用)中使用 NVIDIA Riva TTS 为数以万计的月度活跃用户定制具有当地发音、语调和口音的新加坡语音,该应用同时在线人数高达数千名。 

T-Mobile 客户案例

T-Mobile 在呼叫中心使用 NVIDIA Riva ASR 准确转录客户对话,并提供实时建议,从而帮助代理快速解决客户问题。

RingCentral 客户案例

借助 NVIDIA Riva,RingCentral 在视频会议方面实现了超高的实时转录准确性,为数百万使用特定领域术语且口音各异的用户提供服务。

Tarteel AI 客户案例

Tarteel 使用 NVIDIA Riva 和 NVIDIA NeMo 大规模提供关于《可兰经》朗诵的实时反馈,使穆斯林教徒、讲师、内容创作者和研究人员能够与《可兰经》进行互动。

 Floatbot 客户案例

Floatbot 利用 NVIDIA Riva 和 NVIDIA TAO 开发定制的新加坡英语语音 AI 应用,帮助全球保险公司和金融领域客户实现呼叫中心的自动化。

各行各业的领先采用者。

  • 客户
  • 合作伙伴
  • 服务交付合作伙伴
Artisight
Botify
Botpress
Interactions
Koreai
Lexistems
Malamute
Minerva CQ
Moneypenny
Pendulum
Plabook
Readai
SmartCow
Tarteel
Vectorventures
Computacenter
Data Monsters
InstaDeep
Quantiphi
SoftServe
SVA

已准备好简化您的语音 AI?

免费试用 NVIDIA Riva Enterprsise

在 LaunchPad 上免费试用 Riva。

访问精心策划的 NVIDIA Riva 实验,测试基于语音的解决方案并进行原型设计。

下载 NVIDIA Riva SDK

免费下载 Riva 容器和模型。

从 NVIDIA NGC 部署 NVIDIA Riva。

探索更多资源。

获取简介。

了解 Riva 中帮助您构建语音 AI 服务的主要功能。

探索入门套件。

获取使用 NVIDIA Riva 构建语音 AI 工作流所需的套件,包括教程、Jupyter Notebook 和文档。

观看网络会议。

了解 NVIDIA AI 如何助力您跨数千个流实时构建和运行语音 AI 应用。

查看电子书。

探索如何开始在生产环境中集成和部署 Riva ASR 和 TTS 模型,并轻松进行高性能推理。

注册以接收 NVIDIA 发布的关于语音 AI 的新动态。

借助 LaunchPad 上的 Riva 快速推进您的语音 AI 项目。