在语音处理任务中,有时需要对立体声或多声道音频文件,批量处理成单声道文件,然后送入算法模型进行处理。
这里,提供一个Python脚本实现批量分离,提高处理效率。
编码思路
wavfile
包用前需先导入以下包:
import scipy.io.wavfile
封装代码如下:
def split_stereo(input_path, output_path): # default stereo samplerate, data = wavfile.read(input_path) left = [] right = [] for item in data: left.append(item[0]) right.append(item[1]) file_name = input_path.split('\\')[-1] file_name = file_name.split('.')[0] outfile_name = file_name + '_1ch_left.wav' out_path_file = os.path.join(output_path, outfile_name) wavfile.write(out_path_file, samplerate, np.array(left)) # wavfile.write('right.wav', samplerate, np.array(right))
当然,有兴趣的也可以用专业音频处理软件Audition
实现批量处理。