McKesson 公司数据和技术运营高级经理 Arunkumar Thirunagalingam 告诉 PYMNTS,互联网数据正在耗尽,人工智能公司正在感受到压力。多年来,他们依靠抓取大量在线内容来训练他们的系统。这在一段时间内起到了作用,但现在简单的数据正在枯竭。这种转变使拥有独特数据源(例如医疗记录或物流信息)的公司受到关注。这不再是你能获取多少数据的问题;而是你能获取多少数据的问题。这是关于拥有正确类型的数据。即将到来的数据干旱?人工智能系统依赖来自互联网的大量数据来训练和改进。
然而,高质量、多样化的数据池 买房b 是有限的,研究人的极限。随着模型变得越来越大并且需要更多的输入,重复利用类似信息的风险也会增加,从而导致收益递减。此外,许多互联网内容都是嘈杂或重复的,降低了其对尖端培训的有用性。这种稀缺性挑战研究人员寻求替代方案,例如创建合成数据、利用专门的数据集或开发更少依赖原始数据而更多依赖高级推理能力的模型。蒂鲁纳加林加姆说,随着需要抓取的互联网数据越来越少,企业正在发挥创造力。
他们转向物联网设备和传感器等现实世界来源来收集新信息。众包平台付费让人们分享他们独特的见解,从而创造更多选择。他补充说,这种转变已经在农业领域掀起波澜,人工智能利用实时数据来提高农作物产量,在城市规划领域,城市传感器帮助设计更智能的基础设施。曾经利用被忽视的数据集的公司现在正在寻找新的方法来将其货币化,从合作伙伴关系到许可交易。以前看似不重要的东西现在变成了一座金矿,激发了新的想法和商业模式。 HeraHaven AI 创始人 Komninos Chatzipapas 承认,该行业正在遭遇数据墙。
|