Scale AI 收购 SiaSearch,谁在数据引擎风口抢跑了?

浏览数量: 155     作者: 本站编辑     发布时间: 2021-11-29      来源: 本站

在增长路上一骑绝尘的ScaleAI也在寻找第二曲线了?据外媒最新消息,硅谷AI独角兽ScaleAI已完成对初创企业SiaSearch的收购,旨在提供与特斯拉相同的数据引擎能力,全面布局非结构化数据管理。业内人士透露,数据引擎领军者之争日益激烈,赛道早期布局者如格物钛等已受到资本瞩目。


ScaleAI由两位90后华裔创办,5年时间估值超73亿美金,去年营收上亿成为有史以来增速最快的公司之一。数据标注是其前期核心业务,也许是意识到标注业务竞争激烈、护城河又窄的缘故,Scale开始强调新定位“AI数据平台”,剑指AI开发的下一个核心命题——非结构化数据管理,方有收购SiaSearch之举。


SiaSearch建立了一个数据管理平台,主要功能为高级驾驶辅助系统和自动驾驶系统捕捉的PB级数据搭建的搜索引擎。这家初创公司被收购前已与大众汽车和保时捷等汽车制造商合作,能够自动索引和构建车队收集的原始传感器数据。ScaleAI计划融入SiaSearch技术,以提供所有AI开发人员都可以使用的完整数据引擎,使自动驾驶等技术领域受益。


“数据引擎”为何成为AI开发的香饽饽?即便是特斯拉这样的AI先驱者,数据标注团队达到千人级别,在海量的行车数据面前,千人还是杯水车薪,对此特斯拉内部开发了自动训练框架“数据引擎”(DataEngine)。在今年的特斯拉AI大会上,特斯拉AI总负责人安德鲁·卡帕西(AndrejKarpathy)展示了数据引擎的强大之处:通过数据采集、标注、模型部署等环节,在测试过程中识别出长尾情况、单独测试,未通过的数据会被送到数据容器中,对数据进行加强、重新标签、训练生成模型……如此反复直至覆盖所有场景,在大量训练数据的喂养下,自动驾驶变得越来越聪明。


对于大多数企业来说,数据就是源头,面对海量高速增长的视频、音频、图片等非结构化数据,使用一个高效协同、自动化训练的数据管理平台至关重要。风口的到来让早期布局者备受关注,其中格物钛非结构化数据平台正脱颖而出。


相较于从自动驾驶行业数据搜索起步的SiaSearch,格物钛更早布局全面数据管理,依托于数据引擎,平台的复杂场景数据检索和可视化只是基本功,清晰可溯的权限管控和版本管理、从预标注到持续迭代的全周期承载,才能更好地满足企业算法团队高效AI开发。除了自动驾驶,智慧物流、新零售、直播电商等非结构化数据暴增领域需求正旺,难怪格物钛能获得红杉、云启、真格、风和、耀途以及奇绩创坛等一众资本的青睐。那么谁将成为AI数据管理的头号玩家?ScaleAI?格物钛?拭目以待。


相关产品