是当时客观条件造成的文字转WAV音频