容联AI实现「数据自动化打标」和「测试集自动提取」

来源:江西网络广播电视台    2021-03-08 11:36
2021-03-08 11:36 
分享
分享到
分享到微信

尊敬的用户:

本周迎来容联AI Call产品又一次更新,本次更新重点丰富自学习平台的功能,旨在让运营更智能,提高运营整体工作效率,实现【数据自动打标】,自动将原始数据进行数据清洗、数据标注、数据分类,有效缩短了数据标注工期。同时,打破传统测试集数据手动拆分方式,实现【测试集数据自动提取】,数据提取更科学,评测结果更真实。

如下为V5.1.1本次更新内容:

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑,都可以在自学习平台完成,打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据,通过人工对数据进行标注,无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能,仅需上传原始数据集文件,系统按照配置策略,自动将原始数据进行数据清洗、数据标注、数据分类,人工仅需完成简单的复检,即可将数据用于模型训练,有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制,支持取消训练,在面对大量模型训练任务时,可以更好的承载超大并发量的模型训练任务,从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分,耗时耗力,如果数据拆分不均匀,还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式,仅需在模型训练时,选择所需训练集文件,系统自动按照训练集标签数量提取一定比率的测试集数据出来,数据提取更科学,评测结果更真实。

  5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面,本次新增单意图、多意图、情感、句式识别的模型评测结果输出,同时我们还对模型评测的指标计算方式进行调优处理,使模型结果数据评测更加精准有效。

6、内置通用模型数据,全平台可使用

结合容联在数据上的沉淀积累,容联将百万级数据通过清洗整理,并训练成行业场景的通用模型,尽可能实现开箱即用,减低冷启环节的耗时。本次更新容联将这些模型开放出来,可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级,一方面对数据本身的安全加密,采用符合绝大部分客户要求的密码算法对数据进行主动保护,另一方面对数据防护的安全,采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn