虽然他推测的未必准确文字转WAV音频