34 音频说明资料
在发布 Live 7 之前,Ableton 的大部分开发工作都集中在客观地测试 Live 的基本音频性能上。 根据测试结果,我们已经对音频引擎进行了许多低级别的改进。 我们还编写了这份参考资料,以帮助用户清楚的明白使用某些不易理解的功能是如何修改(或优化)音频的,以及一些获得高音质的技巧。
如上所述,我们的研究重点一直放在客观行为上(即可量化和可衡量的)。 我们对你的监听环境没有任何要求,因为我们可能无法预测你的监听环境、音频硬件、听觉灵敏度等变量。 此外,本文不对 Live 与其他音频软件做任何比较。 相反,这是一篇摘要 — 关于 Live 在各种情况下可能会发生的行为。
34.1 测试与方法
在撰写本文时,Live 的每个版本都接受了 473 个自动测试附件,涵盖 Live 功能的各个方面。 当我们添加新的功能时我们会进行额外的测试,在未通过测试之前绝不会发布更新。
34.2 中性操作
Live 中不会导致音频质量发生变化的过程,称为中性操作。 你无需担心使用这些功能会对信号有所衰减。 从模拟数字化录音转换的角度来看,对录制到 Live 中的音频使用中性操作可确保音频不会发生变化。 对导入到 Live 的文件进行中性操作可确保导入的音频与保存在磁盘上的文件相同。 对于从 Live 导出的文件应用中性操作可确保输出文件的质量至少与播放时听到的质量一样。
下面提供的中性操作列表主要是用作抽象参考的;事实上,尽管这些操作实际上都是中性的,但是要记住,它们有可能(并且几乎一定会)在一些环境中发生非中性的操作。 例如,通过效果器装置处理音频信号是一种非中性操作。 因此,任何中性操作之后都会理所应当的导致音频发生某种程度的改变。 从技术角度来讲,即使是增益的变化都是非中性的。
中性操作包括:
34.2.1 未经抖动处理的渲染
【导出音频/视频】(查看导出音频和视频)命令会将 Live 的音频输出渲染成文件保存在磁盘上。 在某些情况下,【渲染】是中性的操作:
- 渲染文件的采样率与在 Live 【偏好设置】中设置的音频硬件采样率相同。
- 没有应用任何非中性操作。
我们通过以 16 位,24 位和 32 位字长加载三种类型的未处理音频文件(白噪声、固定频率的正弦波和正弦扫频信号)并将它们渲染到输出文件中(使用不同的比特率)来测试 Live 的渲染性能。 原始文件和输出文件的相位抵消测试显示如下:
- 渲染到与原始位深相同的位深文件会导致相位完全抵消。
- 渲染到比原始位深更高的位深度文件会导致相位完全抵消。
- 渲染到比原始位深小的位深时,文件在 32 位系统中产生的失真最小。
34.2.2 匹配采样率/无移调
在 Live 中播放未拉伸的音频文件是一种中性操作,前提是该文件的采样率与 Live 的【偏好设置】中设置的采样率相同,并且该文件的播放不进行移调。 渲染输出的相位抵消测试对此进行了证实。 请注意,我们这里提到所 “播放” 的音频是在 Live 中的音频,并且是到达音频硬件之前的音频。
34.2.3 未拉伸的 Beats/Tones/Texture/Re-Pitch Warp 模式
如果 Clip 的速度与 Set 的速度相同, 那么 Clip 将会在未拉伸的状态下播放。 在这种情况下,如果 Clip 的 Warp 模式(查看获得更好的音频拉伸质量)设置为 Beats/Tones/Texture 或 Re-Pitch(不包括 Complex 和 Cpmplex Pro),那么播放将是中性的。 任何跟随 Set 速度进行 Warp 导致的变化都是非永久性的,并且如果一段音频在特定的速度下未被进行 Warp,那么该音频在该速度下永远都不会进行 Warp,即使速度发生改变之后再改变回来。 例如,如果你以 120 BPM 的速度录制了一些轨道,但随后你决定降低节奏以录制特别困难的独奏,那么将节奏恢复到 120 BPM 后,原始轨道将再次中性播放。 只以较慢节奏录制的内容才会被拉伸。 请注意,【律动】(查看使用律动)会根据 Warp 标记点而发生改变。 这意味着即使以原始速度播放带有【律动】的 Clip 片段,它也是非中性的。
你可以通过对渲染的输出执行相位抵消测试,来验证未拉伸 Clip 的播放是否为中性的。
34.2.4 Summing
从版本 7 开始,Live 便开始使用双精度(64-bit)混合方式来 summing(混合)所有的轨道信号,其中包括 Clip 和返送轨道输入,总线轨和机架。 因此在 Live 当中的信号 summing 都是中性的操作。 我们通过加载一对 24 位文件(白噪声和固定频率正弦波及其相位反转的信号),将这些组合加在一起八次并将输出呈现为 32 位的文件来进行测试。 所有测试都可以完美相位抵消。
请注意,尽管每个单一的轨道上都使用了 64-bit 的 summing 方式,但 Live 的内部运算仍然是用 32-bit 的方式进行的。 因此,多个轨道信号之间混合在一起仍然可能导致极少量的信号衰减。 在 32 位的架构中结合 64 位的 summing,可以在音频质量和 CPU/内存消耗之间达到一个非常理想的平衡。
34.2.5 录制外部信号(位深 >/= A/D 转换器)
将音频信号录制到 Live 中是一项中性的操作,只要在 Live 的【偏好设置】窗口中设置的位深与用于录制的 A / D 转换器的位深度相同或更高即可。 在这里我们提到的 “中性” 表示 “与 A/D 转换器传递给 Live 的音频相同。”
34.2.6 以 32 位录制内部信号
如果以 32 位进行录制,那么通过内部路由录制的音频将与源音频相同。 为了确保乐器插件的录音以及效果器处理音频信号都是中性操作,我们推荐你使用 32 位内部录音。 但是请注意,如果源音频已经处于较低的位深,在该位深的内部录制也将是中性的(假定未使用任何效果);内部以 32 位录制未经处理的 16 位音频文件将不会提高音质。
内部录音为中性操作已经通过了相位抵消测试。
34.2.7 冻结,应用冻结
将轨道冻结(查看轨道冻结)时,创建的音频文件为 32 位,这确保了它们的质量不会低于冻结之前听到的音频。 但是有一些涉及冻结的特殊情况会导致非中性行为,因此应注意:
冻结的 Arrangement 界面轨道可以包含超出 Clip 本身末端的音频素材,例如混响尾音和延迟的重复。 然而,冻结的 Session 界面轨道始终恰好是两个 Loop 周期长度,因此在冻结后,任何在非冻结播放期间延伸超过两个 Loop 周期的音频都将被切断。
时间类效果器诸如混响和延迟,会实时处理未被冻结的 Clip,所以在混响和延迟的尾巴中途停止播放,其尾巴仍旧会继续播放。 相反,被冻结的尾巴会转换为音频,所以在播放尾巴中途停止播放会戛然而止。
任何参数的自动化都将作为 Arrangement Clip 在冻结时音频渲染的一部分。 然而,冻结的 Session 界面 Clip 会在时间轴的 1.1.1 位置上 “抓拍” 所有参数值,并在冻结 Clip 时保留住它们。 这是种类似于未冻结 Clip 的行为;在 Session 界面中播放普通 Clip 时,Arrangement 自动化将会执行【插入录音结束】动作,直到按下【返回 Arrangement】按钮为止。
冻结的 Clip 始终保持在 Wrap 开启的状态,且处于 Beat 模式下时,它们与其他所有 Warp 的音频文件一样属于非中性操作。
任何具有随机参数的装置(例如,Beat Repeat 装置中的 Chance 控件)在冻结后将不再表现出随机行为。 这是因为,与基于时间的效果一样,冻结时已存在的随机值将作为新文件的一部分呈现,因此将不再实时计算。
请注意,【应用冻结】命令将所有原始 Clip 与装置替换为通过冻结创建的音频文件。 使用此命令时,请记住上面的特殊情况 —【冻结】后听到的声音恰好是【应用冻结】时会得到的。 因此,如果冻结的结果不符合你的喜好,请务必在【应用冻结】之前进行一些必要的更改,设置好装置参数。
通过渲染音频轨道的输出,并通过相位消除将其与来自同一轨道的冻结轨道进行比较,以确保文件相同,来测试此过程。
34.2.8 被旁通的效果器
Live 中被旁通的效果器将从信号流中删除。 Live 的内置效果器装置和第三方 VST 和 AU 插件都是如此。 因此,旁通效果器输出端的音频与输入端的音频相同。 但是请注意,一些效果器具有延迟要求的参数(例如 Compressor 中的 Look Ahead 设置)在旁通时仍会引入此延迟,以便在工程的其余部分保持自动延迟补偿。 在大多数情况下,该行为的影响几乎是不可察觉的。
通过将 Live 的每个效果器装置的一个实例加载到音频轨道中,将它们停用并渲染该轨道的输出,来测试旁通效果是否中性。 然后将渲染的文件与没有加载装置的同一轨道进行渲染输出以相比较。 两个文件的相位抵消测试确认它们是相同的。
34.2.9 路由
在 Live 中信号的路由(查看信号输入/输出和路由)是一种中性操作。 路由的目的地信号将与路由源的信号相同。 需要特别注意的是,Live 灵活的路由体系结构可应用于多个方面,包括从任何效果器或调音台之前或之后路由,以及在 Impulse 乐器中分配采样插槽的各个输出。 在这些情况下,在输出点听到的信号可能与在路由之前听到的信号不同,因为在到达其原始信号链的末端之前,它们已经被分流了。
34.2.10 分割 Clip
分割(查看(分割 Clip)后,已经中性的 Clips 将继续保持中性。 【分割】仅影响采样中的播放位置,对采样数据本身没有影响。 【播放】可以保证跨越边界时无缝播放,且采样准确。
Clip 分割的中性在多种条件下进行了测试:
- loop 打开和关闭状态下,对未 Warp 过的 Clip 进行分割;
- loop 打开和关闭状态下,对 Warp 过但没有拉伸的 Clip 进行分割 ;
在所有情况下,都会渲染输出并将其与同一源的未分割版本的输出进行比较。 两个文件的相位抵消测试确认它们是相同的。
34.3 非中性操作
Live 中会导致音频质量发生变化的过程称为非中性操作。 我们可以保证,当用户使用这些操作时,会致使信号至少发生一些变化。 对导入到 Live 的文件进行非中性操作会导致导入的音频与磁盘上保存的文件不同。 在导出过程中施加非中性操作会导致你新生成的文件与你在 Live 中实时播放的文件有所不同。
非中性操作包括:
34.3.1 在 Complex 和 Complex Pro 模式下播放
Complex(查看Complex 模式)和 Complex Pro(查看Complex Pro 模式)Warp 模式中使用的算法与 Beat、Tones、Texture 和 Re-Pitch 模式使用的算法完全不同。 尽管 Complex 模式听起来可能更好,特别是当使用包含很多声音元素的声音文件时,它们永远都不会是中性的 — 即使以原始速度进行播放。 因此,由于这些算法对 CPU 的需求不断增加,我们建议仅在其他 Warp 模式无法产生足够效果的情况下才使用它们。
34.3.2 采样率转换/移调
采样率转换(在实时回放和渲染期间)是一种非中性操作。 播放的音频文件采样率与 Live 偏好设置窗口中设置的采样率不同时,会导致信号受损。 移调也是采样率转换的一种形式,因此它也会导致非中性行为。
为了最大程度地减少实时播放过程中可能出现的负面影响,我们推荐将采样率转换这个环节放在导入之前,而不是在一个 Set 当中共存多个不同采样率的文件。 一旦采样已经按照一定的采样率进行导出,你就可以在 Live 中使用导入文件而不会降低其质量。
从 Live 渲染音频时,采样率不同于工程上使用的采样率时,也会发生非中性的操作。 然而,从 Live 9.1 开始,导出过程中的采样率转换使用了非常高质量的 SoX 重采样库【(本产品包含了SoX Resampler 采样库,并获得 GNU LGPL v2.1 授权许可)】{.footnote},这使得降采样的文件几乎不会失真。
34.3.3 音量自动化
自动化音量水平会使得增益发生变化,这无可厚非是一种非中性操作。 但是自动化包络在某些特定的情况下可能会导致可闻的叠频现象,尤其是当包络运算的不够快速时。 从 Live 7 开始,我们将每个音频采样的音量自动化曲线都进行了更新,从而使失真数量控制至极低。
34.3.4 Summing
当你将音频渲染到较低的位深时,推荐你应用抖动来最大程度地减少叠频。 抖动(一种非常低的噪声)本质上是非中性的过程,但是在降低比特率时,这是必不可少的。
请注意,Live 的内部信号处理都是 32 位的,因此即使施加一个简单的增益改变,音频也将变为 32 位 — 即使原始音频是16 位或 24 位。 抖动本不应用用于任何给定的音频文件,所以除了在 Live 当中进行母带和最后环节的制作以外,最好渲染为 32 位的文件以避免应用抖动。
34.3.5 录制外部信号(位深<A/D 转换器)
如果在 Live 偏好设置窗口中,设置的位深低低于用于 A/D 转换器在录音工作时的位深,那么将音频信号录制到 Live 中是一种非中性操作。 我们不建议你这样做。
34.3.6 录制低于 32 位的内部信号
如果以低于 32 位的位深进行录制,通过内部路由录制的音频将会损失质量。 为了确保乐器插件的录音以及效果器处理音频信号都是中性操作,我们推荐你使用 32 位内部录音。 但是请注意,如果源音频已经处于较低的位深,在该位深的内部录制也将是中性的(假定未使用任何效果);内部以 32 位录制未经处理的 16 位音频文件将不会提高音质。
34.3.7 合并
在 Arrangement 界面中合并 Clip(查看合并 Clips)将会创建新的音频文件,与原始音频数据相比,它们是非中性的。 确切地说,新文件将被响度标准化,其 Clip 音量将调整为与合并之前的音量相同。 响度标准化是一种增益变化,一种非中性操作。 同时,将会以 Live 偏好设置窗口中设置的采样率和位深来创建一个新的文件,该文件可能与原始文件不同。
34.3.8 Clip 淡入淡出
当你在【Record/Warp/Launch】偏好设置中应用了【在 Clip 边缘创建淡入淡出】后,一个短的(最多 4 毫秒)淡入淡出将应用于 Clip 的开始和结束,以避免 Clip 片段的头尾发生咔哒声。 这些 “消除杂音” 的淡入淡出也可以通过【Clip 淡化(查看 Clip RAM 内存模式)】按钮应用于 Session 界面的 Clip 中。 此外,Arrangement 界面中的 Clip 可编辑为淡入淡出和交叉淡入淡出(查看音频 Clip 边缘淡化和交叉淡化)。 应用这些淡入淡出选项都是非中性操作。
34.3.9 声像
Live 使用具有正弦增益曲线的恒定功率来平移声像。 在中心位置输出为 0 dB 时,极左和极右的信号将增加为 +3 dB。 为了最小化这种音量的变化,在做极端的声像处理时,缩窄整体的立体声宽度可能会比较有效。 这可以通过【Utility】装置中的【Width】控件来完成。
34.3.10 律动
在大多数情况下,播放已经过 Warp 处理且与 Set 速度相同的 Clip,是中性操作。 然而,如果你应用了【律动(查看使用律动)】,那么在任何速度下播放都是非中性的。
34.4 实现 Live 最佳音质的技巧
为了满足那些希望在 Live 中获得最佳音质的用户们,我们提供了一套我们推荐的做法与程序设置。
- 在开始工作之前,首先确定要用于工程的采样率,而不要在进行工程中途再更改。
- 使用高质量的硬件组件在 Live 中录制音频(音频接口,线材,等等)并且保证接口和计算机可以支持最高的采样率和位深。
- 请避免在同一工程中使用不同采样率的采样。 如果要使用此类文件,首先建议你将它们转换为(已针对此任务进行了优化的脱机应用程序下的)音频接口设置的采样率。
- 对于所有的音频 Clip,请在 Clip 视窗中禁用 Warp 与淡入淡出选项。
- 请勿调整任何 Clip 的【Transpose】与【Detune】控件。
- 始终以 32 位渲染。
请注意,为了确保最佳的音频质量,请禁用 Live 的某些功能 — 特别是 “拉伸” 和 “同步” 等操作。
34.5 总结与结论
Ableton 撰写此论文,是为了帮助用户准确地理解在 Live 中执行各种处理时,音频是如何受到影响的。 我们聚焦在多年来那些被证实会引起困惑或不确定性的功能上,此处列出的中性和非中性操作列表必然是不完整的。
如果你对我们所介绍的功能有任何疑问,请参考此手册。【(访问https://www.ableton.com/help/)】{.footnote}。如果你还有其他未解决的问题,我们也建议你联系我们。 Live 虽然是一项产品,但它也因为用户的反馈而大大受益,我们期待你能够持续地向我们提出意见和建议。