AI项目和框架 | 第 21 页

DisPose是一项由北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同开发的先进技术，旨在提升人物图像动画的质量。该技术通过从骨骼姿态和参考图像中提取有效的控……

7个月前

DreamOmni港中文、字节等机构共同推出的统一图像生成和编辑模型DreamOmni是什么DreamOmni是由香港中文大学、字节跳动和香港科技大合开发的一款综合图像生成与编辑模型。该模型融合……

7个月前

OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型，专为边缘部署而设计，旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……

7个月前

Sketch2SoundAdobe联合西北大学推出的AI音频生成技术Sketch2Sound是什么Sketch2Sound是一项由Adobe研究院与西北大学合作推出的先进AI音频生成技术。该技术能够根据声音模仿和文本提……

7个月前

Granite3.1IBM推出的新版语言模型Granite3.1是IBM最新推出的语言模型，具备卓越的性能和更为强大的上下文处理能力。该模型系列包含四种不同的规模和两种架构：密集模型的2B和8B参数……

7个月前

Midscene.jsAI驱动的UI自动化测试框架Midscene.js是什么Midscene.js是一款基于人工智能技术的自动化软件开发工具包（SDK），旨在通过大型语言模型（LLM）简化用户界面（UI）自动化……

7个月前

PCAgent上海交大联合GAIR推出的电脑智能体AI系统PCAgent是什么PCAgent是由上海交通大学与GenerativeAIResearchLab(GAIR)共同开发的一款前沿人工智能系统。该系统模拟人类的认知过程……

7个月前

OpenNotebook开源AI笔记工具，自动将多格式笔记转换成博客OpenNotebook是什么OpenNotebook是一款开源、重视隐私的工具，旨在作为谷歌NotebookLM的替代品，帮助用户高效管理研究工作……

7个月前

QVQ阿里通义开源的视觉推理模型QVQ是什么QVQ是阿里巴巴基于Qwen2-VL-72B开发的一款开源多模态推理模型，旨在融合视觉理解与复杂问题解决能力，从而提升人工智能的认知水平。该模型……

7个月前

ASALSakanaAI联合OpenAI等推出使用基础模型搜索人工生命的系统ASAL（AutomatedSearchforArtificialLife）是一款由SakanaAI与MIT、OpenAI等机构联合开发的自动化搜索人工生命（ALife……

7个月前

1…19 202122 23…68

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐