对于任何正在实施机器学习(ML)解决方案以用于数据以进行分析和商业智能目的的企业而言,该过程的任何部分都比数据标记更加费力。没有它,机器学习算法就无法完成他们的监督训练,这是建立可靠的学习模式的前提。简而言之,数据标记是构建深度学习系统的基础。
但是,由于工作的关键任务性质,企业将任务外包是很常见的。他们这样做是为了降低开销,并确保在流程的每个阶段都正确完成工作。但是外包数据标签会带来一些风险。因此,正在考虑采取这一举措的企业在致力于数据标签外包计划之前就知道了要做什么。这里是涉及的风险以及如何在可能的情况下将其最小化。
不良声誉效应
由于数据标记的需求已经上升了一段时间,因此它变成了蓝领工作。用于执行此操作的工具和技术已变得标准化且易于使用,这降低了负责处理该操作的工人的知识要求。
结果,这些任务通常交给监管较少的发展中经济体的人们。这是通过控制劳动力成本来降低日常开支的一种方法。对于试图快速,经济地完成工作的企业来说,这是一件好事,但这种安排也会适得其反。
在发展中国家,使用低薪工人寻求外包协议的公司可能会面临公关和品牌灾难的风险。与许多其他类型的外包一样,当地流离失所的工人以及认为这种做法是对外国工人的剥削形式的人都产生了强烈的反对。仅仅声誉受损就可能是避免外包数据标签任务的足够理由。
难以选择有信誉的合作伙伴
并非所有外包都是不好的,特别是如果您要与信誉良好的外包公司合作。例如,您可以确保将工作外包给一家向员工支付生活费的公司。您还可以确保公司内部的文化对所有员工都是积极的和支持的。
当然,这可能意味着您必须为他们的服务多付一些钱,但现实是成本仍然是任何内部选择的一小部分。但是,告诉外包合作伙伴何时才能达到您期望的标准并不总是那么容易。当您与之合作的公司位于世界另一端,无法监控其日常运营时,尤其如此。
在这种情况下,唯一的选择是仔细研究。有关您正在考虑与之合作的公司的评论通常是最好的资源。如果您很周全,那么您应该能够找到一家关心其员工队伍并会以良好方式开展工作的公司。
沟通困难
与世界其他地方的公司合作意味着您可能无法与处理您的工作的团队轻松沟通。鉴于数据标记是一项关键任务,并且是更大,更复杂的过程的一部分,不良的通信可能会带来各种不利影响。
减轻这种风险的唯一方法是彻底审核您的外包合作伙伴,以确保他们使用的工作人员精通本组织中负责监督工作人员所使用的母语。用您的母语找到从上到下流利的公司的可能性很小,但这并不意味着您不会找到至少有少数人精通您的语言以形成关键沟通的公司与其他员工沟通。
为了让您更加放心,并确保不会出现任何意外,您可以要求所有离岸员工在接受使用之前进行全面理解测试。这是您能够验证他们的沟通能力是否足以胜任您的项目的最直接方法。
意外暴露敏感数据
无论大小,企业都几乎不断受到网络犯罪分子的攻击。这些攻击一旦成功突破防御,便使公司损失了巨额资金。数据泄露不仅使客户面临身份被盗的危险,而且使公司一旦遭受数据泄露,就很难重新获得人们的信任。这就是公司现在将大量资源用于网络安全的原因。
但是,在外包数据标签时,您公司的数据将仅保持外包伙伴保留的安全性。您计划与之合作的伙伴可能没有采取贵公司为保护其网络而采取的预防措施。您可能会将公司的数据信任易受恶意软件或病毒攻击的第三方。
根据您所移交数据的敏感性,您可能需要要求对合作伙伴所有数字系统进行全面的网络安全审查。您还需要担心员工。如果您要共享敏感且有价值的数据,则需要确保该第三方的员工不会尝试窃取您的数据。
您可以采取几个步骤来确保员工的数据安全,例如坚持要求每个员工都要进行背景调查。您还可以要求员工签署保密协议,该协议将提供一定的法律追索权和对流氓员工的威慑力。另一个步骤可能是确保第三方公司禁用员工的数据下载能力。
底线
外包数据标签绝对是企业应该考虑的事情。那些不放弃比竞争对手更大的经营优势的公司。要记住的重要一点是,选择不能盲目地做出。您必须认识到这些缺点,以便您能够在其成为您将来遇到的问题之前正确解决它们。
好消息是,有很多方法(如此处讨论的方法)来限制与数据标签外包相关的风险。通过花时间制定和执行周密的外包计划,企业可以享受外包数据标签的所有好处,而不必担心以后会再来困扰他们的决定。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


雷达卡



京公网安备 11010802022788号







