人工智能道德与数据治理：良性循环

随着很多企业投入大量资金和人力研究和开发人工智能，他们面临着隐私与道德的相关问题。例如，负责任的人工智能是什么样的?如何控制人工智能偏见?人工智能技术是前沿技术，它对社会发展有着严重的影响。但在企业能够解决道德问题之前，他们应该关注数据治理的更基本问题。人工智能技术在过去五年中发展迅速。很多人认为神经网络在某些任务中比人类做得更好，特别是在某些图像分类系统中。企业可以利用这些先进的人工智能功能来简化运营，提高利润，降低成本，并改善客户服务。但Information Builders公司阿姆斯特丹办事处数据管理卓越中心的国际主管James Cotton说，尽管人工智能技术很强大，但如果基础数据管理不善，就不能以合乎道德的方式实施。他指出，了解数据治理与人工智能道德之间的关系至关重要。他说，“数据治理是人工智能道德的基础。如果企业不知道自己拥有什么，数据来自哪里，数据是如何使用的，或者数据被用于什么目的，就不能以道德的方式使用数据。” 实施GDPR法规是一个良好的开端企业面临的挑战在于没有适用的数据治理的标准或方法。而欧盟推出的通用数据保护法规(GDPR)就是一个良好的开端，但即使实施GDPR法规也不足以确保在所有情况下都能实现良好的数据治理。而人们希望通过2021年推出的电子隐私条例(ePR)法来解决这一问题。对于同一数据块，采用良好治理的规则可能会有所不同，这取决于如何收集它们以及如何使用它们，这是问题之一。 Cotton说，“人们都倾向于把数据看作一堆1和0，并在数据库中存放大量数据。事实上，并非所有数据都是平等创建的。当然，也并非所有数据都被同等对待，而且可能不应该这样。” Cotton表示，例如记录中某位客户的头发是红色的，这并不被视为“个人数据”。他说，“这并没有什么个人暗示。但如果他或她住在芬兰北部一个只有20人的村庄，将这两个特征相结合，合并的数据集可能能够识别这个客户，因此应该以不同的方式处理。” Cotton表示，这种不断变化的数据性质可能会破坏企业遵守GDPR法规的能力，更不用说提供有意义的信息来长期训练人工智能模型。其最佳实践是不要在与原始数据集合相关联的场景之外使用数据。但数据和数据治理的其他方面对人工智能和模型训练有着更直接的影响，其中之一就是糟糕的数据。错误的数据那些希望在人工智能技术方面有所成就的企业都希望获得准确和正确的数据，这是因为可以提高人工智能的有效性和实用性。由于数据准确性是良好数据治理的副产品，因此采用良好的数据治理实践符合企业的本身利益。这是循环的良性部分：良好的数据治理导致开发更好的人工智能，而更好的人工智能反过来支持更符合道德的人工智能。人们还可以想象，如果客户相信开发商以合乎道德的方式实施人工智能，他们会更愿意与开发商共享更多、更好的数据，如果他们知道它不会被滥用，并且是准确的，他们也可能从中得到一些有益的东西。但如果数据质量一开始就很低，其输出的结果将会更加糟糕。 Cotton说，“我们知道，世界上大部分数据都是错误的。”这些数据质量错误来自各种地方。问题是，一将它们应用到人工智能上，无论人工智能技术能否处理这些问题，人工智能只会在大规模上做出错误的决定。” Information Builders公司将数据治理解决方案作为其套件的一部分出售。该软件可以帮助客户回答这样的问题：“例如，这些数据来自何处?为什么首先收集这些数据?在此过程中，我们对它做了什么?出于什么原因?谁最后使用了它?它在哪里使用?它是如何被利用的?我们是否对此认同?” Cotton说：“任何合适的数据管理项目都存在这样的问题。如今，当越来越多的