如果检测到的指标并不充分文字转WAV音频