因为在他们大多数的记忆里文字转WAV音频