返回文章列表
产品更新ElevenLabsScribe语音转文本转录

隆重推出 ElevenLabs Scribe:一流的 AI 转录模型

2026年5月29日
5 分钟阅读
隆重推出 ElevenLabs Scribe:一流的 AI 转录模型

隆重推出 ElevenLabs Scribe:一流的 AI 转录模型

我们非常高兴地宣布 SRTGen AI 字幕生成器 的重大升级。今天,我们正式将 ElevenLabs Scribe v2 集成到我们的平台中——让您能够使用世界上最准确、抗噪能力最强、最精确的语音转文本 (STT) 模型之一。

通过此次更新,我们还在您的字幕创建设置中引入了多层级模型结构。我们原有的转录模型保持不变,现已被指定为 基础层,而全新的 ElevenLabs Scribe 引擎则作为我们的高级 专业层 推出。

SRTGen 中的 ElevenLabs Scribe 集成

了解新的模型层级

为了让您在速度、准确性和积分成本方面拥有最大的灵活性,现在您在转录媒体时可以在两个不同的模型层级之间进行选择:

  • 基础层 (AssemblyAI Universal-2): 这是我们原始的、高度可靠的转录引擎。它针对标准速度和通用内容进行了优化。如果您的音频清晰,并且是英语或常见的欧洲语言,基础层是您以我们标准积分费率获取快速、准确字幕的完美选择。
  • 专业层 (ElevenLabs Scribe v2): 这是我们全新的高级转录引擎。由 ElevenLabs Scribe 提供支持,专业层专为高级本地化项目、嘈杂的视频日志、口音较重的采访以及亚秒级计时和高准确性不可或缺的非拉丁语系脚本而构建。

什么是 ElevenLabs Scribe?

ElevenLabs Scribe 是一种最先进的语音转文本模型,旨在提供类人般精度的语音识别。Scribe v2 经过数百万小时的高质量多语言语音数据训练,擅长转录令标准转录工具难以处理的复杂声学细节。

通过将此模型作为我们的专业层引入 SRTGen,我们正在为专业创作者、电影制作人和 UGC 编辑提供当今市场上最高级别的准确性。

为什么 ElevenLabs Scribe(专业层)更胜一筹

以下是 Pro Scribe v2 模型成为您下一个字幕项目终极选择的关键原因:

1. 非拉丁语系的卓越精度

标准 ASR 模型通常大量依赖西方拉丁文字的音频进行训练,导致在其他地区出现较高的词错误率。Scribe 从头开始构建,旨在实现全球覆盖,为非拉丁文字脚本提供卓越的准确性,包括:

  • 亚洲语言: 中文(普通话/粤语)、日语、韩语、印地语、泰语、越南语等。
  • 中东语言: 阿拉伯语、希伯来语、波斯语等。

如果您正在为东亚或中东市场进行内容本地化,Scribe 可以大幅减少拼写错误和不正确的字符渲染。

2. 亚秒级时间戳精度

对于高质量的字幕动画(例如我们流行的卡拉OK式效果),时间是关键。如果高亮动画稍微落后于音频,观众的沉浸感就会被打破。Scribe v2 提供精确的词级别对齐,几乎将每个音节都对齐到实际语音窗口的 100 毫秒以内。这带来了令人难以置信的流畅、同步的字幕流。

3. 卓越的噪音和口音抗性

现实世界的音频很少在隔音工作室中录制。Scribe 能够轻松处理:

  • 嘈杂的户外环境(视频日志、街头采访)。
  • 带有大量背景音乐或音效的视频。
  • 带有浓重地域口音或语速快的说话者。

它能滤除声学静态噪音,并以最少的错误成功转录实际语音。

4. 智能填充词清理

在对话中,人们自然会在言语中夹杂“嗯”、“啊”、“比如”、“你知道”等不流畅的词语。Scribe 包含一个智能填充词清理选项。当您在 SRTGen 中开启 “移除填充词” 时,我们会将 no_verbatim 选项直接传递给 ElevenLabs,立即去除冗余内容,为您留下清晰、可发布的字幕文本。

5. 多说话人识别

Scribe 自动识别不同说话者的发言(支持多达 32 种不同的声音)。它将对话分割成清晰、带有说话人标签的字幕卡片,让您可以在我们的专业字幕编辑器中轻松分配颜色或组名。

如何在 SRTGen 中使用 ElevenLabs Scribe

使用新模型非常简单:

  1. 打开 SRTGen 工作区 并点击 “新项目”
  2. 上传您的视频或音频文件。
  3. “转录 AI 模型” 下,选择 “专业” 选项(由 ElevenLabs Scribe 提供支持)。要使用原始模型,请选择 “基础”
  4. 配置可选设置(如 移除填充词标记音频事件),然后点击 “生成字幕”

可用性

专业版 ElevenLabs Scribe 模型现已立即在所有 入门版、专业版和商业版 订阅计划中提供。Scribe v2 将从您的统一月度配额中扣除积分,从而轻松实现高容量视频制作的扩展。

体验下一代语音转文本的准确性。立即前往 SRTGen 工作区 试用 ElevenLabs Scribe!


David Lin

David Lin

Founder, SRTGen

Video creator and developer focused on building professional automation tools.