恺望数据创始人兼CEO于旭
9月7日,AI数据服务公司恺望数据宣布完成由亚盛投资领投的Pre-A轮数千万级别融资,清智资本参与投资。
【资料图】
据了解,这是恺望数据在一年内完成的第三次融资,此前天使轮及天使+轮投资方包括辰韬资本、璞跃中国、三一集团和溪山天使汇等。
恺望数据成立于2022年2月,致力于打造AI数据自动化平台,面向车企、自动驾驶公司以及人工智能等跨产业企业提供一站式AI数据解决方案。
目前,恺望数据的产品已迭代至最新版的“Smart Chain恺望自动化AI数据产线”。新的数据产线包括“3D辅助标注”工具平台、“4D-BEV数据拼接与标注”工具链、“5KW大点云”工具平台,以及“6大数据生态闭环解决方案”。
国内首个可支持4D-BEV数据拼接与标注工具链今年以来,落地城市NOA是自动驾驶领域的必争之地,而BEV感知是通往城市NOA的必经之路,国内不少布局自动驾驶的车企及技术公司均在加速推动BEV感知算法落地,而决定着算法及模型速度的重要要素,则是数据的质量和效率。
对此,恺望数据推出了国内首个可支持4D-BEV感知算法的数据拼接及数据标注工具链,该工具可支持大数据流并行作业,支持200万人同时标注,目前已在车企应用。
恺望数据创始人兼CEO于旭表示,自动驾驶行业对于优质、高效及稳定的大规模数据需求不断增长,“以往可能只看价格,现在既看价格,还要求稳定、高质量与高效率。”
为此,恺望数据通过研发新的技术工具,降低人员的学习难度、标注难度,降低单帧数据处理的精神消耗,从而提高数据处理速度和质量。
于旭介绍,恺望数据推出的“3D辅助标注”工具是国内唯一一个在2D中标记后反投影到3D中精准找到标注物的工具,“5KW大点云”工具平台则是国内首个实现可在8G内存电脑上运行的5千万点云数据标注能力的工具。
当前业内点云数据处理的领先水平大约是200万至300万点云,具备上千万级别点云数据标注能力的工具和平台较为稀缺。
恺望数据技术及产品负责人表示,通过自研Web多线程调度系统,完成点云异步加载和渲染,“5KW大点云”工具平台对硬件的要求不高,可在8G内存电脑上运行,上限可支持1亿点云加载。
“Web多线程技术执行复杂的计算、处理大量数据、进行后台网络请求都在后台线程中运行,不会影响用户界面的响应性,将数据加载、点云处理、渲染分开异步完成处理的同时不会影响业务正常使用。”
公司月订单超1500万元恺望数据的突出特点是将自动化技术与规模化人力运营管理相结合,推动数据生产线从手工作坊转向兼具标准化、规模化和自动化的“现代工厂”。
这与创始人于旭及其团队的背景分不开。
于旭毕业于法国昂热大学,是字节跳动、Momenta、Uber等企业数据生产及运营体系的第一搭建者,拥有多段从零到一的大数据平台搭建经验。在Uber中国时期,于旭积累了丰富的大规模人力运营的经验。
恺望其他团队成员来自字节跳动、阿里巴巴、Uber、Momenta、梅赛德斯-奔驰等公司。
于旭认为,目前要解决自动驾驶数据的长尾问题,仍无法全自动化。“随着自动驾驶对高质量、高产效数据的需求逐步提升,数据标注已经从低成本人力标注,逐渐变为了高阶标注人才的需求。”
比自动驾驶更需要“高端标注人员”的,是AI大模型行业。随着AI大模型成为新的热门行业,恺望数据客户也从车企、自动驾驶公司拓展至人工智能公司。
于旭表示,AI大模型的数据来自各类垂直专业领域,需要大量本科及以上学历各专业的毕业生参与标注,但这类“垂类高阶标注人才”在行业内极为稀缺。
针对这些需求,恺望数据自去年以来打造的“恺望数据学院”有一定优势。恺望数据通过于高校合作共建产融实训基地,储备并培训了大批高校学生标注员。
于旭透露,目前恺望数据学院已培训50所学校,培养超过1500名学生为恺望提供数据标注服务,计划至今年年底将超过2000人规模。
目前,恺望数据已在自动驾驶领域与长安、广汽、奇瑞、上汽等车企,以及毫末、旷视、元戎等自动驾驶公司建立合作关系,在AI大模型领域的合作客户包括商汤、字节跳动与文心一言等。于旭表示,公司单月订单已超1500万元。
雷峰网(公众号:雷峰网)雷峰网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
标签: