当前位置> 首页 > 科技成果 > 清洁能源
全球首个原生多模态世界模型Emu3
类 别:清洁能源
地 区:市辖区
单位名称:石家庄科技大厦一楼西展厅
联系电话:0311-89687911
发布时间:2026-04-30

原生多模态世界模型Emu3只基于下一个token预测,无需扩散模型或组合方法,在全球首次实现了文本、图像、视频多模态的原生统一理解与生成,验证了下一代多模态的技术路径,实现了对物理世界的理解及模拟,探索了一条通向多模态通用人工智能(AGI)的可行技术路径。目前,Emu3在图像生成、视频生成、视觉语言理解等任务中已超过SDXL、LLaVA、OpenSora等知名开源模型。Emu3被业内专家评价为改写了多模态人工智能的规则,重新定义了多模态AI,使得多模态AI的未来变得更加精炼与强大。