关于resampler痰音的思考
今天在观察共振峰特征的时候,突发奇想,试图执行一个目力PSOLA。
首先选中一个短的重复片段:
然后复制并粘贴一次。
虽然粘贴时已经选择了从时域观察相位差最小的位置,但是仍然可以看到出现了一个频谱上的高能量。
并且经过试听,此处有痰音的特征。
因此做出猜测:resampler并没有实现真正的PSOLA,或是用户标注的标记位置存在问题,导致拼接时频谱出现高能量。高能量可能是由于相位差造成的,并非从时域分析可以判断解决。
今天在观察共振峰特征的时候,突发奇想,试图执行一个目力PSOLA。
首先选中一个短的重复片段:
然后复制并粘贴一次。
虽然粘贴时已经选择了从时域观察相位差最小的位置,但是仍然可以看到出现了一个频谱上的高能量。
并且经过试听,此处有痰音的特征。
因此做出猜测:resampler并没有实现真正的PSOLA,或是用户标注的标记位置存在问题,导致拼接时频谱出现高能量。高能量可能是由于相位差造成的,并非从时域分析可以判断解决。