也就是现在的故宫所在文字转WAV音频