常规数据采集
在数据采集过程中,首要的是保证数据是符合项目要求。我们注重数据的多样性,比如说话人分布均衡、采集设备的多样性等。
采集特色
提供多语种(常用语种和小语种)以及方言采集;
模拟真实场景采集数据,如车载数据、会议数据、唤醒词等;
提供特定音色的采集;
建立专业的录音间和不同混响的采集环境;
支持多通道多设备录制,同时提供远场数据和近场数据。
快速将产品部署到不同国家和地区;
保证数据多样性,减少模型偏见;
让设备的声音更接近流畅自然;
提高模型在复杂环境下的性能。