前两次是试镜与翻拍文字转WAV音频