我只能分辨出其中几种文字转WAV音频