根据汇聚过来的气数规模判断文字转WAV音频