AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
I2V-01-Live:海螺AI创新图生视频模型助力创意内容生成与视觉表现提升
I2V-01-Live是一款由海螺AI推出的创新图像转视频模型,能够将静态的二维图像转化为生动的动态视频。基于先进的深度学习技术,I2V-01-Live不仅提升了动作的流畅性和自然度,还能有效……
复旦联合微软等机构推出的端到端身份一致性视频扩散框架
产品名称:StableAnimator产品简介:StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学共同推出的端到端高质量身份保持视频扩散框架。StableAnimator能根据一张……
ConsisID:智能文本到视频生成模型实现创意内容的快速转化
ConsisID是一种由北京大学与鹏城实验室等机构联合开发的文本到视频(Text-to-Video,IPT2V)生成模型。它利用频率分解技术确保视频中人物身份的一致性。该模型采用免调优(tuning-fr……
TPDM:创新时间预测扩散模型推动高校科研合作与发展
TPDM(时间预测扩散模型)是由西湖大学MAPLE实验室、南方科技大学、北京大学以及西湖大学高等研究院先进技术研究所共同研发的图像生成模型。该模型具备自适应调整去噪时间表的能力……
MagicDriveDiT:高分辨率自动驾驶长视频生成技术创新与应用
MagicDriveDiT是一种新型视频生成技术,由香港中文大学、香港科技大学、华为云及华为诺亚方舟实验室联合开发,专为自动驾驶应用而设计。该技术基于DiT架构,能够高效生成高分辨率及……
GeneMAN:创新3D人体模型创建框架助力精准数字化人体重建
GeneMAN是一款由上海AI实验室、北京大学、南洋理工大学和上海交通大学联合开发的3D人形创建框架,能够从单张图片中生成高保真的3D人体模型。该框架不依赖传统的参数化人体模型,而……
首尔国立大学推出的单参考图像生成多身份全身图像技术
产品名称:PersonaCraft产品简介:PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像……
开源AI检索生成框架,自动生成精确的SQL查询
产品名称:Vanna产品简介:Vanna是开源的PythonRAG(Retrieval-AugmentedGeneration)框架,能帮助用户基于大型语言模型(LLMs)为其数据库生成精确的SQL查询。Vanna用两步简单流程……
Make-It-Animatable:中科大与腾讯联手打造智能即时动画生成资产系统
Make-It-Animatable是由中国科学技术大学与腾讯PCG联合开发的一种数据驱动框架,能够在短短一秒钟内将任何3D人形模型转换为可用于角色动画的状态,无论其外观或姿势如何。该框架通……
CAT4D:基于单目视频技术的创新4D场景生成方法解析
CAT4D是一款由GoogleDeepMind、哥伦比亚大学和加州大学圣地亚哥分校联合开发的先进技术,能够从单目视频中生成动态的4D场景表示。通过利用多视图视频扩散模型,CAT4D可以在特定的相……