为人工智能研发企业提供语音数据采集与标注服务

  • 客户痛点

    客户为新成立的人工智能研发企业,其发展速度快、行业知名度高。客户的痛点在于,其语音智能系统的研发需要一定数量和质量的真人语音数据,但是客户在短时间内很难完成这些数据的采集和标注。因此,客户委托文思海辉根据给定文本在室内专业录音场景下完成真人语音采集和标注。


  • 功能描述
    • 文思海辉为客户组建了一支120名录音人员的团队,男女比例为1:1,年龄阶段为18-40岁,以确保音质的多样化。
    • 文思海辉为本项目搭建了特定的室内录音场景,采用专业设备进行多轨录音,以实现混响效果,确保采集到高质量的音频。
    • 文思海辉聘请专业的音频处理团队对音频进行后期合轨与切分——把21轨合并为3轨、把整段音频切割成单句,与文本一一对应,并通过质检过程确保数据准确。

     

  • 客户收益
    • 文思海辉丰富的众包资源可为客户提供7*24无缝衔接工作,共采集了长达70小时的音频,后处理并交付语音数据100,000条,音频数据准确率高达98%。
    • 专业录音场景、专业音频处理团队和高质量的众包资源,保证了文思海辉交付给客户的产品的质量,从而更好地服务于客户的研发需求。
    • 文思海辉创新的众包服务模式和成熟的内部项目管理,在确保交付质量的同时也帮助客户节省了项目成本。