AI项目和框架 | 第 6 页

LlamaV-o1多模态视觉推理模型，采用逐步推理学习方法解决复杂任务LlamaV-o1是什么LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构研发的新一代多模态视觉推理模型，旨在……

5个月前

CogView-3-Flash智谱推出的首个免费AI图像生成模型CogView-3-Flash是什么CogView-3-Flash是智谱推出的首个免费AI图像生成模型，能够根据用户提供的文本描述生成高审美分数的图像，……

5个月前

GLM-Realtime智谱推出的端到端多模态模型GLM-Realtime是一款由智谱推出的先进端到端多模态模型，具备低延迟的视频理解和语音交互功能，独特地加入了清唱能力，使得大模型在对话中展……

5个月前

StepR-mini阶跃星辰推出的Step系列首个推理模型StepR-mini是阶跃星辰推出的首款推理模型，专注于主动规划、尝试与反思，运用慢思考和验证机制，致力于为用户提供精准可靠的回答。该……

5个月前

RealtimeSTTAI实时语音转文本库，自动检测说话的开始与结束RealtimeSTT是什么RealtimeSTT是一款开源的实时语音转文本库，专为低延迟应用场景而设计。它具备强大的语音活动检测功能……

5个月前

Pipecat构建语音和多模态对话代理的开源框架Pipecat概述Pipecat是一个开源的Python框架，旨在简化语音和多模态对话代理的构建。通过集成内置的语音识别、文本转语音（TTS）和对话处……

5个月前

LumaRay2LumaAI推出的最新视频生成模型LumaRay2是什么LumaRay2是LumaAI最新推出的视频生成模型，基于全新的多模态架构进行训练，展现出卓越的功能。这一架构的计算能力是Ray1的10倍……

5个月前

产品名称：FreeScale产品简介：FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架，提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和……

6个月前

Make-It-Animatable是由中国科学技术大学与腾讯PCG联合开发的一种数据驱动框架，能够在短短一秒钟内将任何3D人形模型转换为可用于角色动画的状态，无论其外观或姿势如何。该框架通……

6个月前

AgentLaboratoryAMD联合约翰·霍普金斯大学推出的自主科研AgentAgentLaboratory是什么AgentLaboratory是由AMD与约翰·霍普金斯大合开发的一个基于大型语言模型（LLM）的自主研究平台……

6个月前

1…4 567 8…68

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐