|
2018年离开Uber回国后,我加入了一家高精度地图初创公司担任合伙人,因高精度地图研发需要收集海量数据并训练大量模型,为了管理和使用这些数据,我们一直在寻找类似于Michelangelo的平台。我们找了各种各样的供应商,甚至包括多家国内头部云服务商,可是没有一家可以满足我们的需求,在那个瞬间感觉特别无助。
当时我意识到无论是国内还是国外,人工智能研发的整个工具链都处于非常早期阶段而且不完善。如果我们再做一家人工智能公司,还会遇到同样的问题,还是要花很大代价把这些问题再解决一遍。后来我去找了很多在人工智能领域创业的朋友,发现他们也有同样的痛点。与其这样,不如专门做一家帮助开发者解决以图像、文字、视频为代表的非结构化数据管理和使用痛点的公司,让开发者从繁杂的数据管理中脱身,更好地将时间和精力集中在解决业务问题上。
我们希望所有的开发者都可以用到和大公司一样好用的工具,让人工智能不再遥远,我们创立Graviti就是肩负着这样的使命的。
CSDN:我们注意到Graviti的Slogan 是“让AI触手可及”,Graviti所面临的挑战是怎样的?难点在哪里?
崔运凯:这里我们先来区分一下结构化数据和非机构化数据。日常数据可以分为由程序生成的结构化数据与以视频、图像、文字为代表的非结构化数据。平日里大家接触到的数据处理大部分是针对结构化数据的处理,比如Excel表格,数据库等。而人工智能面对的更多是图像、文字、视频等非结构化数据。这些数据所占用的存储资源及处理难度是结构化数据的几百万倍甚至是几亿倍。
举个例子,Excel表格中100条数据只有几KB大小,但是一个图片可能需要几MB的空间,而一个视频则需要几百MB的空间。这很直观的展现了结构化数据和非结构化数据在数量级上的对比。处理一个Excel表格和几张图片都是相对简单的任务,基本在个人电脑上都可以处理。但是AI要处理的任务可能是上百万个几百MB的视频,这里程序所面临的挑战和所需要耗费的存储和算力成本可想而知。全世界每天产生亿万量级的非结构化数据,是否能有效地处理好利用好这些数据,决定了人工智能的发展进程。
Graviti希望通过高效调度大量的算力及存储,利用大规模分布式并行化技术,打造一站式的创新解决方案,帮助解决非结构化数据从获取、管理、加工到使用的完整数据旅程中所面临的问题,这也是我们的价值所在。
CSDN:Graviti提供怎样的产品?又是如何解决开发者的痛点的?
崔运凯:大家猜猜支持一个10人算法团队高效运转需要多少资源?我们通过深度调查发现,至少要三个软件工程师提供工具开发和运维服务,需要配置百万元左右的深度学习训练机器,及百人左右的标注团队和上百TB到PB级的共享存储空间。这些加起来往往需要花掉企业千万级前置成本和百万级的维护费用。即使这些都具备,算法工程师还要将大量的时间花在找数据,清理数据,管理权限和可视化上,真正用于算法开发的时间屈指可数。
针对这个情况,Graviti提供了面向开发者的SaaS工具,集数据集管理,沙箱训练和模型评估于一体。打通数据在人工智能应用开发的各个环节中的流转。让企业0前置成本启动人工智能应用开发项目,后期费用跟随团队的扩张而增加、收缩而减少,让开发者真正专注在重要的事情上。
比如我们与淞泓智能的合作,就使用了我们的数据管理系统和模型评估系统,甚至包括模型管理系统,并为它搭建了一套在线测试平台,让它更好地去测试未来无人驾驶车辆的系统安全性;在伯克利(UC Berkeley)的合作中,也是通过我们的数据管理平台、评估系统,为其搭建了一个平台用来支持他们面向世界级的顶级学术人员和开发者发布的挑战赛,这样大家可以更好地促进相关技术的发展。
针对开发者对于真值数据的需求,Graviti提供了基于SaaS的标注服务。和其他标注公司不一样的是,我们的数据标注服务是一键式的。国内的标注公司通常是先联系BPO(商务流程外包Business Process Outsourcing),在线下的微信群里对接需求,发数据文档,他再去联系标注员,而很多标注员可能是第一次接触这样的任务,也没有特别适用的工具。但是在我们的体系里,所有对接都是在软件中交互完成,分发程序有一套算法,会自动找到最合适的标注员,通过发现任务、自主登录、接受培训考试去完成这样的工作。整个过程都是自动化的,效率和准确率都有很大的提升。我们会针对客户的业务情况做咨询,很多客户是做不到明确架构需求的,这时候就需要有人来从专业角度做梳理和设计,这也是我们服务的独特性所在。
我们也将在未来的一定时间点考虑开源我的软件或是去做开放平台,和更多合作伙伴做生态上的整合,协同解决更多AI问题,打造像Github一样被开发者喜爱的平台。

(编辑:荆门站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|