Bark 是一款高度逼真的开源、生成式文字转语音模型。它可以生成类似真人的多语言语音,还能生成音乐、背景噪音等简单的音效,以及可以根据文字内容产生笑、叹息和哭泣、喘息声、清嗓子等声音。英语效果优秀,中文效果一般。@Appinn

Bark - 高度逼真的开源、生成式文字转语音模型 1

感谢 @orange.ai 的推荐:

  • 非常真实自然的语音
  • 英文效果最佳,其他语言还欠佳
  • 支持通过文本生成歌曲
  • 支持生成背景噪音、简单的音效
  • 支持大笑、叹息、哭泣
  • 开源模型,自己可以下载玩,也可以去官方排队体验

Bark 使用 MIT 许可证,允许商用。经过 CPU 和 GPU 测试(pytorch 2.0+, CUDA 11.7 和 CUDA 12.0)。

例子

Bark 是完全生成式的文本-音频模型,它不是传统的 TTS 模型,会根据文字描述生成很多意想不到的内容。

获取

  • https://github.com/suno-ai/bark

原文:https://xbcpy.com/