AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
星火人设
星火人设科大讯飞推出的专为情感交互设计的模型星火人设是科大讯飞推出的一款专注于情感交互的模型(角色模拟API),其设计旨在提供更为丰富的人物设定、剧情演绎与语言风格控制选……
TransPixar
TransPixar港中文联合Adobe等机构开源的生成透明背景视频技术TransPixar是什么TransPixar是一种由香港中文大学、Adobe研究院、香港科技大学和智能摩尔共同开源的尖端文本到视频生成……
Aria-UI
Aria-UI港大联合RhymesAI开源面向GUI智能交互的多模态模型Aria-UI是什么Aria-UI是由香港大学与RhymesAI联合开发的一个大型多模态模型,旨在处理图形用户界面(GUI)中的定位任务。……
MultiBooth
MultiBooth清华联合Meta等机构推出的多概念图像生成方法MultiBooth是什么MultiBooth是一种由清华大学深圳国际研究生院、Meta和香港科技大学等机构共同研发的多概念图像生成技术。该……
Ingredients
Ingredients多ID照片定制视频生成框架,基于多ID照片与视频扩散相结合XX是什么Ingredients是一个创新的框架,结合了多种特定身份(ID)照片与视频扩散Transformer技术,旨在实现个……
ArtCrafter
ArtCrafter清华联合鹏城实验室和联想共同推出的文本到图像风格迁移框架ArtCrafter是什么ArtCrafter是由清华大学、鹏城实验室与联想研究院联合开发的一款创新的文本到图像风格迁移框……
Seer
Seer上海AILab联合北大等机构推出的端到端操作模型Seer是一款由上海AI实验室、北京大学计算机科学与技术学院及北京大学软件与微电子学院等机构联合研发的先进端到端操作模型。它实……
MiniMax-01
MiniMax-01MiniMax开源的全新系列模型MiniMax-01是MiniMax公司推出的最新系列大模型,包含了基础的语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列模型首次在大规模……
MinMo
MinMo阿里通义实验室推出的多模态语音交互大模型MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的一款先进的多模态大模型,专注于实现无缝的语音交互体验。它具有约80亿个参数,通……
Kokoro-TTS
Kokoro-TTS轻量级文本转语音模型,支持多语言多语音风格生成Kokoro-TTS是由hexgrad开发的一款轻量级文本转语音(TTS)模型,参数高达8200万。它结合了StyleTTS2和ISTFTNet的混合架……