您正在浏览的是香港网站,香港证监会BJA907号,投资有风险,交易需谨慎
市场资讯

市场资讯

首页市场资讯资讯详情

商汤(00020.HK)提出多项大模型和生成式AI相关技术突破

阿思达克 10-05 15:39
全球人工智能计算机视觉领域顶级国际会议ICCV(International Conference on Computer Vision)于10月2至6日在法国巴黎举行。商汤(00020.HK)表示,与联合实验室共49篇论文入选,涵盖文生图、3D数字人、自动驾驶、目标检测、视频分割等多个与大模型和生成式AI相关的热门题目。 基于商汤AI大装置SenseCore和「日日新SenseNova」大模型体系,商汤在生成式AI和视觉大模型等领域上,提出多项技术突破和研究范式创新。 在生成式AI方面的文生图领域,商汤研究团队提出将人类偏好引入Stable Diffusion的模型训练中,证明人类偏好信息可以提升Stable Diffusion生成的图像质量,尤其是在人体、四肢等容易出现误差的情况下,展示优异的效果。 此外,商汤研究团队亦提出一种基于单张图片的可泛化及可驱动人体神经辐射场方法,仅需一张从任意角度拍摄的3D人体图片,结合必要的参数,就能实现3D数字人的重建和驱动,有望简化3D数字人的创作流程。 商汤研究团队另提出合成数据集SynBody,其构建了穿著衣物的参数化人体模型,并生成海量的人体虚拟数据,有助于3D人体感知和重建的模型训练。此外,团队公布开源代码库XRFeitoria,这是一个合成数据渲染工具箱,通过提供方便的Python API与CLI工具,简化制作虚拟数据集的流程。 在自动驾驶场景的3D目标检测领域,商汤团队提出一种全新用于多视角3D检测的时序增强训练方式─历史帧物体预测(Historical Object Prediction, HoP),不仅在nuScenes测试集上使用ViT-L得到68.5%NDS和62.4% mAP,超过排行榜上所有3D物体检测器,还可以「即插即用」,无缝集成到最先进的BEV检测框架中,重塑3D检测时序利用的新范式。