人工智能非常复杂,而且发展速度很快。任何人都不可能对其未来几年的发展方向做出准确的预测。但是对于大数据来说,或许我们可以猜测一二:人工智能将帮助回答有关数据的重大问题。
许多针对数据技术和数据集成的投资都未能回答这样的一个重大问题:投资回报率在哪?现在,人工智能正在为这些数据项目提供商业案例,新的工具将会使这些项目的价值凸显出来。
企业不再需要决定"清理数据"——也不应该这样做。他们应该首先从一个业务问题开始来量化人工智能的好处。一旦数据被用来解决一个特定的问题,进一步开发数据驱动的人工智能解决方案就会变得更容易,从而就会形成一个良性循环。 问题出在了哪里?一些企业仍然在犹豫要不要建立,或者是没有建立好数据基础。
许多公司没有看到他们对大数据进行投资带来的收益。这里有一个脱节。商业和技术行业的高管们认为他们可以用数据做更多的事情,但学习曲线非常陡峭,工具也不成熟。所以他们面临着相当大的挑战。
现在,随着应用场景的成熟和人工智能本身变得更加真实和实用,一些人正在重新思考他们的数据战略。他们开始提出正确的问题,例如:如何使我们的流程更有效率?需要做些什么才能实现数据提取的自动化?
同时,企业现在可以利用新的工具和技术进步,其中包括:
采用更简便的方法挖掘结构较差的数据,比如那些用于文本索引和分类的自然语言处理
企业应用程序套件将包含越来越多的人工智能工具
新兴的数据湖即服务的平台
可以利用不同类型数据的公共云
自动化地机器学习和数据管理
喂养AI野兽
尽管取得了这些进展,但许多企业仍然面临着诸多挑战。许多类型的人工智能(如监督式机器学习和深度学习)需要大量标准化、标签化的数据,并且还要把偏差和异常的数据“清除”掉。否则,不完整或有偏见的数据集将导致错误的结果。这些数据也必须足够具体,才能有用,当然,也要保护个人隐私。
考虑一个典型的银行业务流程。各个业务线(例如零售,信用卡和经纪业务)都有自己的*集。其中不同部门(例如营销部门,账户创建部门和客户服务部门)也都有自己的数据格式。一个人工智能系统可以识别银行中最赚钱的客户是谁,也能为如何找到并赢得更多像他们这样的客户提供建议。但要做到这一点,系统需要以标准化的、无偏见的形式访问各业务线和各部门的数据。
正确的数据处理方法
从清理数据的开始并不是个好主意。从商业案例开始,然后评估如何在这个具体案例中取得成功会比较好。
例如,医疗保健供应商可能会致力于改善病人的治疗效果。在开始开发系统之前,供应商会量化人工智能可以带来的好处。供应商接下来将研究需要哪些数据——电子病历,相关期刊文章和临床试验数据等——以及获取和清理这些数据的成本。
只有供应商的收益——包括间接收益以及未来的应用程序如何使用这些数据,能够超过成本的情况下,供应商才会向前推进。
这就是有多少企业最终会改革数据架构和管理的衡量方法:人工智能和其他技术提供了需要它的价值主张。
影响
成功将会带来成功
那些已经为一个应用程序解决了数据问题的企业,将会在下一个计划中有一个良好的开端。它们将开发最具实践性的项目,从而有效利用其数据资源并跨越企业边界进行工作。
第三方数据供应商将蓬勃发展
企业内部的数据对于人工智能和其他创新来说是无可替代的,但有一个补充:第三方供应商将会越来越多地采用公共数据源,将其组织成数据湖,并为人工智能的使用做好准备。
更多的*数据即将到来
随着数据变得更有价值,*数据和其他“精益”和“增强”数据学习的技术进步将加速。例如,我们可能不需要一整队自动驾驶汽车生成它们将会在路上如何行驶的数据。 只需要少数的一些汽车, 加上精密的数学计算,就足够了。
内容来自网络