而是按照心态计算的文字转WAV音频