他们用什么量文字转WAV音频