标签:AI项目和框架

StyleStudio
StyleStudio文本驱动的风格迁移模型,能将参考图像的风格与文本提示内容融合StyleStudio是什么StyleStudio是由西湖大学AI实验室、复旦大学、南洋理工大学与香港科技大学(广州)联……
OpenAI o3
OpenAIo3OpenAI推出的新一代最强推理模型OpenAIo3是一款新一代的推理模型,继o1之后推出,包括o3和o3-mini两个版本。o3在某些条件下的表现接近通用人工智能(AGI),在ARC-AGI基准……
MetaMorph:智能多模态产品提升用户体验与交互效率
MetaMorph是一款先进的多模态大模型(MLLM),通过指令微调(InstructionTuning)实现视觉理解与生成。其创新的Visual-PredictiveInstructionTuning(VPiT)方法使得预训练的大型语……
AgentScope
AgentScope阿里开源的多智能体开发平台AgentScope是什么AgentScope是由阿里巴巴集团推出的开源多智能体开发平台,旨在帮助开发者便捷地构建和部署多智能体应用。其设计强调高易用性……
LeviTor
LeviTor南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术LeviTor是什么LeviTor是由学、蚂蚁集团和浙江大学等机构联合开发的一项前沿图像到视频合成技术。该技术通过结合深度信……
MetaMorph:智能多模态产品提升用户体验与交互效率
MetaMorph是一款先进的多模态大模型(MLLM),通过指令微调(InstructionTuning)实现视觉理解与生成。其创新的Visual-PredictiveInstructionTuning(VPiT)方法使得预训练的大型语……
AgentScope
AgentScope阿里开源的多智能体开发平台AgentScope是什么AgentScope是由阿里巴巴集团推出的开源多智能体开发平台,旨在帮助开发者便捷地构建和部署多智能体应用。其设计强调高易用性……
LeviTor
LeviTor南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术LeviTor是什么LeviTor是由学、蚂蚁集团和浙江大学等机构联合开发的一项前沿图像到视频合成技术。该技术通过结合深度信……
Qwen2vl-Flux:多模态图像生成模型赋能创意无限,支持多样化生成模式
Qwen2VL-Flux是一款先进的多模态图像生成模型,结合了Qwen2VL的视觉语言理解能力与FLUX框架。它能够根据文本提示和图像参考生成高质量的图像,支持多种生成模式,如变体生成、图像……
AniDoc
AniDoc2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画AniDoc是什么AniDoc是由香港科技大学、蚂蚁集团、学、浙江大学和香港大合研发的一款先进的2D动画上色AI模型……
1434445464768