标签:AI项目和框架

InvSR:高清修复老旧照片的开源超分辨率模型提升细节与清晰度
InvSR是一款创新的图像超分辨率模型,它依托扩散模型的逆向过程,从低分辨率图像中恢复出高分辨率图像。通过利用大型预训练扩散模型所蕴含的丰富图像先验知识,InvSR显著提升了超分……
Bamba-9B:Mamba2架构驱动的高效解码语言模型展现卓越性能与灵活应用
Bamba-9B是由IBM、普林斯顿大学、卡内基梅隆大学及伊利诺伊大学香槟分校联合开发的一款基于Mamba2架构的解码型语言模型。该模型在完全开放的数据集上进行训练,旨在提升大型语言模……
MetaMorph
MetaMorph统一多模态理解与生成大模型,基于VPiT预测多模态tokenMetaMorph是什么MetaMorph是一个先进的多模态大模型(MLLM),通过指令微调(InstructionTuning)实现视觉理解与生……
DisPose
DisPose北大等多所高校推出的增强人物图像控制动画质量的技术DisPose是什么DisPose是由北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队联合开发的一项先进技术,旨……
InvSR
InvSR开源图像超分辨率模型,高清修复老旧照片InvSR是什么InvSR是一款创新的图像超分辨率模型,利用基于扩散模型的逆过程来恢复高分辨率图像。通过应用预训练的大型扩散模型所蕴含……
VisionFM:少样本多疾病诊断的智能眼科AI模型
VisionFM(伏羲慧眼)是一款专为眼科领域开发的多模态多任务视觉基础模型,旨在推动通用人工智能在眼科的应用。经过对3.4百万张来自560,457个个体的眼科图像的预训练,VisionFM能有……
AgentScope:阿里开源多智能体开发平台实现高效协作与智能决策
AgentScope是阿里巴巴集团推出的开源多智能体开发平台,旨在帮助开发者高效地构建和部署多智能体应用。该平台具备卓越的易用性、强大的鲁棒性及分布式支持,内置多种模型API和本地……
Univer:智能办公助手全面提升Word和Excel文档处理效率
Univer是一个开源的全栈框架,旨在为用户提供全面而强大的办公解决方案,支持电子表格、文档和幻灯片的创建与编辑。该框架不仅能够在浏览器中运行,还可以在Node.js环境下使用,便……
Mathtutor on Groq
MathtutoronGroqAI数学辅导工具,支持用语音形式提出数学问题MathtutoronGroq是什么MathtutoronGroq是一款先进的AI数学辅导工具,依托于Groq架构,专注于通过语音识别功能帮助用户……
The Language of Motion
TheLanguageofMotion斯坦福李飞飞团队推出的统一多模态语言模型什么是TheLanguageofMotionTheLanguageofMotion是由斯坦福大学李飞飞教授的团队开发的一种多模态语言模型,旨在融合……
1212223242568