他们占据的资源也是足够多的文字转WAV音频