摘要:人工智能背后的数据服务行业主要使用外包与众包两种模式达成,但外包的成本较高,众包则更难以保证数据质量。本文针对外包与众包模式中数据服务中数据成本高,质量难以把控的痛点,通过调研数据生产过程接包方参与动机与参与结果进行研究,确定影响数据成本与质量的主要因素有用户素质,任务难度等,针对相应的影响因素,结合实际案例提出了拆分简化任务,筛选合适的工作人员,使用模型与规则辅助等优化策略。
关键词:人工智能;数据服务;众包;外包;优化策略
目录
摘要
Abstract
一、绪论-3
1.1研究背景及意义-3
1.2研究内容-4
1.3本文创新点-4
1.4文献综述(见附件)-4
二、相关概念界定-4
2.1外包模式与众包模式-4
2.2数据服务平台概念界定-5
2.2.1国内外数据服务平台概述-5
2.3优化策略面向对象与评估指标-6
2.3.1数据质量控制-6
2.3.2数据成本控制-6
三、外包与众包模式分析-6
3.1外包模式-6
3.1.1外包模式优势分析-6
3.1.2外包模式存在的问题-7
3.2众包模式-7
3.2.1众包模式优势分析-7
3.2.2众包模式存在的问题-8
3.3两种模式差异与适用性分析-8
四、针对数据质量控制的优化策略-9
4.1.数据质量的影响因素-9
4.1.1用户参与动机与投入时间对数据质量的影响-9
4.1.2用户经验对数据质量的影响-10
4.1.3任务难度对数据质量的影响-12
4.1.4质量评估方式与标准对数据质量的影响-13
4.2 同属性框体共同排列审核新流程-14
4.3通过规则与模型发现错误-16
五、针对数据成本控制的优化策略-16
5. 1数据成本的影响因素-16
5.1.1数据成本的计算公式-16
5.1.2数据成本的影响因素-17
5.2基于影响因素的数据成本控制策略-17
5.2.1用工具提升效率-17
5.2.1.1模型输出预标注结果-17
5.2.1.2智能化工具的使用-18
5.2.2竞标以降低人力资源成本-19
5.3数据安全策略-19
六、结束语-20