其实不是说人的主动意识文字转WAV音频