ElevenLabs发布Scribe语音转文本模型,准确率创新高

ElevenLabs近期发布了其最新的语音转文本模型Scribe v1,据AIBase报道,该模型在多种语言中实现了极高的准确性,特别是在英语中,其准确率达到了96.7%。Scribe支持99种语言,并能在复杂的音频环境中区分多达32位不同的说话者。该模型的定价为每小时0.40美元,并且在未来六周内将提供50%的折扣优惠。此外,ElevenLabs还宣布了一项新功能,允许作者在他们的Reader应用程序上发布AI生成的有声读物。