游戏《光环》中的
人工智能科塔娜说过一句话,
“我是他的盾牌,我是他的利刃;我深知他,连同他的过去和未来”。
如何打造一个能想会说、能听会看的AI,
在人工智能发展过程中一直是个
全球性难题。
视频理解正进行着此项挑战。
作为“六感”之首的视觉,占据了人类吸收外部信息的70%以上。如果说人工智能的远景是打造一个具有大脑、神经、躯干与四肢的机器人,那么,硬件基础是躯干、四肢,更重要的是,要使得机器人能看会想、能听会说,就要搭建神经和大脑。
训练视觉模型的目标是教会AI看见和理解现实世界,其中,点云视频理解对于智能体与世界的交互至关重要。
近日,国际计算机视觉顶会CVPR 2023在加拿大温哥华举行。作为国际计算机视觉与模式识别领域的三大顶级会议之一,CVPR备受关注。云从科技及联合研究团队的论文《PointCMP: Contrastive Mask Prediction for Self-supervised Learning _disibledevent="margin: 0px; padding: 0px;">重要。在海量数据之上,借助自监督技术推动点云视频理解,也许会帮助我们打造一个能想会说、能听会看的AI。