否则他一开始就应该用文字转WAV音频