第一层次要服从于第二层次文字转WAV音频