在第二阶段开始之前文字转WAV音频