则是用身体去感知世界文字转WAV音频