所在位置: 杭州网>杭州影像
当机器人走进“数字道场”这场“走进”活动让我们看到一场改变未来的虚拟修炼
杭州网  发布时间:2025-06-21 09:06:18 Sat   

记者 金静馨 摄

杭港大厦四楼,几十双眼睛正紧盯着屏幕——画面中,机器人在千变万化的客厅里流畅穿行,精准绕开散落的玩具与错落的椅脚。

“用多大力气可以打开一个柜子?”“捡起一个玩具,从哪个角度可以放进筐里?”群核科技的空间智能平台SpatialVerse资深技术专家赵庆说,这些我们日常看起来平平无奇的操作,对机器人而言,却是一件难事。每一个动作背后,都涉及复杂的感知、判断与执行过程。

6月19日下午,浙江省科协“走进”系列科普活动,走进了被誉为“杭州六小龙”之一的群核科技,带着公众掀开人工智能最神秘的训练幕布。

为机器人打造“数字道场”

训练效果可以实现“爆炸性”增长

从53秒减少至1.2秒——这是“酷家乐”处理一张典型2K图像GPU渲染的最新速度。

作为全球最大的空间设计平台,群核科技旗下的“酷家乐”是一场效率革命的发起者。以前,家居设计行业的出图环节一直是效率瓶颈。“酷家乐”依托强大的GPU集群和自主研发的云端实时渲染引擎,将原本动辄数小时的渲染任务压缩至几秒钟完成,“过去设计师需要数天完成的渲染图,如今一杯咖啡未凉,方案已跃然眼前”。

3.62亿个3D模型及空间设计元素,是“酷家乐”积累下来的数据。这些多场景的室内空间数据,不仅构建起一个庞大的数字世界,更为群核科技从“空间设计平台”迈向“空间智能赛道”提供了坚实支撑。在这里,每一帧渲染不仅是画面的生成,更是未来空间的智慧预演。

“目前的人形机器人在运动控制和小脑技术方面已经取得了长足进展,”赵庆娓娓道来,“但真正让它们‘聪明’起来的是数据。”“机器人要像人一样思考、决策,就需要海量可交互的三维数据作为‘训练场’,这就像人类的学习过程,没有足够的练习和反馈,就无法真正理解世界。”赵庆告诉大家,目前可交互的三维数据是突破人形机器人发展的瓶颈之一。

早在2018年,群核科技就和帝国理工学院、南加州大学展开了一项极具前瞻性的科研合作——发布当时全球最大的室内场景认知深度学习数据集InteriorNet。他们“脑洞大开”,把原本展示给业主的三维虚拟环境提供给机器人“学习”,让机器人在虚拟空间里观察、理解,然后做出决策。通过这种方式,探索怎么让机器人更好地适应现实世界里那些复杂的环境。

看过《黑客帝国》的朋友,肯定对墨菲斯给尼奥搭建的“数字道场”印象深刻。在那个虚拟空间里,尼奥不管经历什么,都只是数据在变化,等他训练完,回到现实世界就能大显身手。

现在,群核科技干的事儿就和这差不多,他们也在为具身智能、AIGC(人工智能生成内容)等打造“数字道场”,帮助AI走进真实的物理世界,推动空间智能的发展。“我们用群核科技平台积累的海量可交互三维数据和先进的渲染技术,给机器人搭建了很多高逼真、强交互的仿真环境。”赵庆一边说着,一边指向屏幕,“在这些虚拟环境里,机器人可以模拟现实世界里的复杂场景,一遍又一遍地训练。”

就拿最常见的扫地机器人来说,不同家庭的环境差别可太大了。家具怎么摆、房间干不干净、光线亮不亮,这些都会影响扫地机器人的清扫任务。有了群核空间智能平台(SpatialVerse)打造的海量仿真训练环境,扫地机器人可以在虚拟空间里进行亿万次训练,模拟各种不同的家庭环境和清扫任务。而且,在数字世界中,时间是被压缩的,“天上一天,人间一年”,在真实世界走一段10公里的路程可能需要半天,但在数字世界只需要几秒。这让实验和训练的速度大幅提升,训练效果就像坐了火箭一样飞速提升。

从造梦到落地

空间智能让机器人更“智能”

“AI设计师会完全取代人类设计师吗?”“未来机器人可以帮我写作业吗?”随着赵庆的分享接近尾声,现场的大小朋友们纷纷举手,迫不及待地抛出他们的问题。

赵庆笑着回答:“其实我们人类最早发明机器人,就是因为‘懒’。我们想让机器人帮我们工作,所以有了工业机器人;现在,我们想让机器人帮我们做家务,所以越来越多的家庭服务机器人正在出现。当然未来机器人一定会有帮我们完成作业的能力。但学习这件事,是属于自己的成长旅程,是不能、也不该由机器人来代替的。”

在谈到未来机器人的应用和发展,一位观众说:“我还指望机器人帮我养老呢。”赵庆向大家透露:“我们现在合作的一些企业,已经在部署机器人到医院、养老院等,用于日常护理、陪伴、环境监测等任务。相信在不久的将来,机器人会成为我们生活中温暖而可靠的‘银发助手’。”

分享结束后,大家又兴致勃勃地参观了群核科技的展厅。一进入展厅,一块巨大的数据大屏便映入眼帘,屏幕上不断跳动的数字仿佛是整个平台的“心跳”:今日发起渲染任务1809397次,这个数字还在不断增长,而全球用户任务也如潮水般涌动……

赵庆告诉大家,这背后正是群核科技两大核心技术引擎——启真(渲染)引擎和矩阵(CAD)引擎的协同发力。“如果说我们是在为AI打造一个理解世界的‘眼睛’,那么启真引擎就是这个‘眼睛’的核心。”比如在当下火热的跨境电商领域,基于此引擎的酷家乐棚拍解决方案,就深受出海卖家青睐。而如果说启真引擎负责“造梦”,那矩阵引擎则负责“落地”。作为群核自研的CAD建模引擎,矩阵引擎能够对空间进行高精度、结构化的描述,是AI真正理解物理世界的基础能力之一。通过矩阵引擎,AI不仅能识别一张桌子的形状,还能理解它是用来吃饭的、还是工作用的;不仅能知道一间屋子的长宽高,还能判断哪里适合放沙发、哪里该留通道。这种结构化的能力,正是让AI从“看得见”走向“看得懂”的关键一步。

来源:都市快报  作者:记者 翁丹妮  编辑:郑海云