标签:AI项目和框架

3D-Speaker
3D-Speaker阿里通义推出的多模态说话人识别任务开源项目3D-Speaker是阿里巴巴通义实验室语音团队推出的创新多模态开源项目,旨在通过整合声学、语义和视觉信息,实现高效精准的说话……
Kheish
Kheish开源的多智能体协调平台,可灵活配置多个Agent解决复杂任务Kheish是一个开源的多智能体编排平台,基于大型语言模型(LLM)构建,通过多个专门角色(智能体)和灵活的工作流程……
Univer
Univer开源AI办公工具,支持Word、Excel等文档处理全栈解决方案Univer是一个开源的全栈框架,旨在为用户提供强大的办公解决方案,支持创建和编辑电子表格、文档及幻灯片。它不仅能……
Bamba-9B
Bamba-9B基于Mamba2架构的仅解码语言模型Bamba-9B是由IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校共同开发的先进语言模型,基于Mamba2架构,专注于解码任务。该模型……
VSI-Bench
VSI-Bench李飞飞谢赛宁团队推出的视觉空间智能基准测试集VSI-Bench是一种全新的视觉空间智能基准测试集,由李飞飞、谢赛宁及其研究团队共同开发,旨在评估多模态大型语言模型(MLLM……
cobalt
cobalt开源的流媒体下载工具,支持全平台视频、音频和图片下载cobalt是一款开源流媒体下载工具,旨在为用户提供无广告、简洁的使用体验。它支持全平台的视频、音频和图片下载,兼容……
ModernBERT
ModernBERT英伟达和HuggingFace等机构联合开源的新一代编码器模型ModernBERT:下一代自然语言处理模型的革新ModernBERT是由Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和Hugg……
Valley
Valley字节跳动推出的多模态大模型Valley是什么Valley是字节跳动推出的一款多模态大模型,旨在处理文本、图像和视频等多种数据类型的复杂任务。该模型在内部的电子商务和短视频基准……
Enhance-A-Video
Enhance-A-Video上海AILab联合新加坡国立等推出的视频生成质量增强算法Enhance-A-Video是什么Enhance-A-Video是由新加坡国立大学、上海人工智能实验室与德克萨斯大学奥斯汀分校联合……
MNN
MNN阿里开源的移动端深度学习推理框架MNN是什么MNN(MobileNeuralNetwork)是由阿里巴巴集团推出的一个开源轻量级深度学习推理框架,旨在为移动设备、服务器、个人电脑和嵌入式设备……
1383940414268