他是需要念动巨大的文字转WAV音频