AI项目和框架 | 第 40 页

3D-Speaker阿里通义推出的多模态说话人识别任务开源项目3D-Speaker是阿里巴巴通义实验室语音团队推出的创新多模态开源项目，旨在通过整合声学、语义和视觉信息，实现高效精准的说话……

6个月前

Kheish开源的多智能体协调平台，可灵活配置多个Agent解决复杂任务Kheish是一个开源的多智能体编排平台，基于大型语言模型（LLM）构建，通过多个专门角色（智能体）和灵活的工作流程……

6个月前

Univer开源AI办公工具，支持Word、Excel等文档处理全栈解决方案Univer是一个开源的全栈框架，旨在为用户提供强大的办公解决方案，支持创建和编辑电子表格、文档及幻灯片。它不仅能……

6个月前

Bamba-9B基于Mamba2架构的仅解码语言模型Bamba-9B是由IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校共同开发的先进语言模型，基于Mamba2架构，专注于解码任务。该模型……

6个月前

VSI-Bench李飞飞谢赛宁团队推出的视觉空间智能基准测试集VSI-Bench是一种全新的视觉空间智能基准测试集，由李飞飞、谢赛宁及其研究团队共同开发，旨在评估多模态大型语言模型（MLLM……

6个月前

cobalt开源的流媒体下载工具，支持全平台视频、音频和图片下载cobalt是一款开源流媒体下载工具，旨在为用户提供无广告、简洁的使用体验。它支持全平台的视频、音频和图片下载，兼容……

6个月前

ModernBERT英伟达和HuggingFace等机构联合开源的新一代编码器模型ModernBERT：下一代自然语言处理模型的革新ModernBERT是由Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和Hugg……

6个月前

Valley字节跳动推出的多模态大模型Valley是什么Valley是字节跳动推出的一款多模态大模型，旨在处理文本、图像和视频等多种数据类型的复杂任务。该模型在内部的电子商务和短视频基准……

6个月前

Enhance-A-Video上海AILab联合新加坡国立等推出的视频生成质量增强算法Enhance-A-Video是什么Enhance-A-Video是由新加坡国立大学、上海人工智能实验室与德克萨斯大学奥斯汀分校联合……

6个月前

MNN阿里开源的移动端深度学习推理框架MNN是什么MNN（MobileNeuralNetwork）是由阿里巴巴集团推出的一个开源轻量级深度学习推理框架，旨在为移动设备、服务器、个人电脑和嵌入式设备……

6个月前

1…38 394041 42…68

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐