标签:AI项目和框架

DisPose:提升动画质量的智能人物图像控制技术
DisPose是一项由北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同开发的先进技术,旨在提升人物图像动画的质量。该技术通过从骨骼姿态和参考图像中提取有效的控……
DreamOmni
DreamOmni港中文、字节等机构共同推出的统一图像生成和编辑模型DreamOmni是什么DreamOmni是由香港中文大学、字节跳动和香港科技大合开发的一款综合图像生成与编辑模型。该模型融合……
OmniAudio-2.6B
OmniAudio-2.6BNexaAI推出的端侧多模态音频语言模型OmniAudio-2.6B是NexaAI推出的一款创新音频语言模型,专为边缘部署而设计,旨在实现快速且高效的音频文本处理。该模型拥有2.6亿……
Sketch2Sound
Sketch2SoundAdobe联合西北大学推出的AI音频生成技术Sketch2Sound是什么Sketch2Sound是一项由Adobe研究院与西北大学合作推出的先进AI音频生成技术。该技术能够根据声音模仿和文本提……
Granite 3.1
Granite3.1IBM推出的新版语言模型Granite3.1是IBM最新推出的语言模型,具备卓越的性能和更为强大的上下文处理能力。该模型系列包含四种不同的规模和两种架构:密集模型的2B和8B参数……
Midscene.js
Midscene.jsAI驱动的UI自动化测试框架Midscene.js是什么Midscene.js是一款基于人工智能技术的自动化软件开发工具包(SDK),旨在通过大型语言模型(LLM)简化用户界面(UI)自动化……
PC Agent
PCAgent上海交大联合GAIR推出的电脑智能体AI系统PCAgent是什么PCAgent是由上海交通大学与GenerativeAIResearchLab(GAIR)共同开发的一款前沿人工智能系统。该系统模拟人类的认知过程……
Open Notebook
OpenNotebook开源AI笔记工具,自动将多格式笔记转换成博客OpenNotebook是什么OpenNotebook是一款开源、重视隐私的工具,旨在作为谷歌NotebookLM的替代品,帮助用户高效管理研究工作……
QVQ
QVQ阿里通义开源的视觉推理模型QVQ是什么QVQ是阿里巴巴基于Qwen2-VL-72B开发的一款开源多模态推理模型,旨在融合视觉理解与复杂问题解决能力,从而提升人工智能的认知水平。该模型……
ASAL
ASALSakanaAI联合OpenAI等推出使用基础模型搜索人工生命的系统ASAL(AutomatedSearchforArtificialLife)是一款由SakanaAI与MIT、OpenAI等机构联合开发的自动化搜索人工生命(ALife……
1192021222368