因为这不仅是一个正确的选择文字转WAV音频