然后用手去抓文字转WAV音频