AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
LIGER
LIGERMetaAI等机构推出的混合检索模型LIGER是什么LIGER是一款由MetaAI等机构推出的混合检索模型,旨在融合生成式检索与密集检索的优势。该模型利用生成式检索模块生成有限的候选项……
SPRIGHT
SPRIGHT专注于空间关系的大型视觉语言数据集SPRIGHT是什么SPRIGHT(SPatiallyRIGHT)是由亚利桑那州立大学、Intel实验室、HuggingFace和华盛顿大学等多家机构合作开发的一个大型视……
VideoRAG
VideoRAG用于长视频理解的检索增强生成技术VideoRAG是一项专为长视频理解而设计的检索增强生成(Retrieval-AugmentedGeneration)技术,旨在提升大型视频语言模型(LVLMs)对长视频……
Mobile-Agent
Mobile-Agent自主多模态移动设备代理,通过视觉感知实现智能化手机操作Mobile-Agent是什么Mobile-Agent是一种具有高度灵活性的智能代理软件实体,能够在网络的不同节点之间移动,代……
Edicho
Edicho蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法Edicho是什么Edicho是由香港科技大学、蚂蚁集团、斯坦福大学和香港中文大合开发的一种基于扩散模型的图像编辑工具,旨在……
CHRONOS
CHRONOS阿里通义联合上海交大等推出时间线摘要生成新框架CHRONOS是什么CHRONOS是由上海交通大学计算机科学与工程系与阿里巴巴集团通义实验室等机构联合开发的一种创新框架,旨在通……
LatentSync
LatentSync字节联合北交大开源的端到端唇形同步框架LatentSync是由字节跳动和北京交通大学共同开发的前沿唇形同步框架,基于音频条件的潜在扩散模型,旨在无需依赖任何中间的3D表示……
InstructMove
InstructMove东京大合Adobe推出基于指令的图像编辑模型InstructMove是什么InstructMove是由东京大学与Adobe公司联合开发的一款基于指令的图像编辑模型。该模型通过分析视频帧之间的……
PersonaMagic
PersonaMagic高保真人脸定制技术,根据肖像无缝生成新角色PersonaMagic是什么PersonaMagic是一项开创性的高保真人脸个性化定制技术,利用阶段调节的文本条件策略实现独特的图像生成……
CreatiLayout
CreatiLayout复旦和字节联合推出创新的布局到图像生成技术CreatiLayout是什么CreatiLayout是由复旦大学与字节跳动合作开发的一项前沿技术,旨在实现从布局到图像的生成(Layout-to-……