AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
TinyTroupe:多智能体角色模拟库助力智能交互与协作创新
TinyTroupe是一款由微软开发的实验性Python库,旨在模拟具有独特个性、兴趣和目标的人工代理(TinyPersons),并在虚拟环境(TinyWorld)中进行互动。该工具基于先进的大型语言模型……
GameGen-X
GameGen-X是一款由香港科技大学和中国科学技术大学的研究团队开发的先进扩散变换器模型,旨在生成和交互控制开放世界游戏视频。此模型不仅能够模拟游戏引擎的功能,如创造新角色、……
DiffSplat
DiffSplat北大联合字节推出的3D生成框架DiffSplat是什么DiffSplat是一种创新的3D生成技术,能够根据文本提示和单视图图像快速构建3D高斯点阵(GaussianSplats)。这种方法通过对预……
BitsAI-CR
BitsAI-CR字节跳动推出的自动化代码审查工具BitsAI-CR是什么BitsAI-CR是字节跳动团队推出的一款基于大型语言模型(LLM)的自动化代码审查工具,旨在提升代码审查的效率和准确性。该……
X-Prompt
X-Prompt用于多模态视频目标分割的通用框架什么是X-PromptX-Prompt是一款针对多模态视频目标分割的通用框架,旨在克服传统方法在极端光照、快速及背景干扰等复杂场景中的局限性。该……
IP-Adapter
IP-Adapter是一种先进的图像生成工具,旨在通过结合图像提示与文本提示,提升预训练文本到图像扩散模型(如StableDiffusion)的表现。该技术由腾讯AI实验室的研究团队研发,旨在简……
无问芯穹开源的端侧全模态理解模型
产品名称:Megrez-3B-Omni产品简介:Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试集上展现……
ID-Animator
ID-Animator是一种由腾讯光子工作室、中科大及中科院合肥物质科学研究院的科研团队推出的零样本(zero-shot)视频生成技术。它能够基于单张面部图像创建个性化视频,同时保留人物的……
音频驱动的生成肖像说话视频框架,保持身份一致性和表现力
产品名称:MEMO产品简介:MEMO(Memory-GuidedEMOtionawarediffusion)是SkyworkAI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的……
Eko
EkoFellouAI推出的开源AI代理开发框架Eko是什么Eko是FellouAI推出的一款成熟的JavaScript框架,旨在通过自然语言驱动的方式,帮助开发者轻松构建从基本指令到复杂流程的智能代理。E……