标签:AI项目和框架

LlamaV-o1
LlamaV-o1多模态视觉推理模型,采用逐步推理学习方法解决复杂任务LlamaV-o1是什么LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构研发的新一代多模态视觉推理模型,旨在……
CogView-3-Flash
CogView-3-Flash智谱推出的首个免费AI图像生成模型CogView-3-Flash是什么CogView-3-Flash是智谱推出的首个免费AI图像生成模型,能够根据用户提供的文本描述生成高审美分数的图像,……
GLM-Realtime
GLM-Realtime智谱推出的端到端多模态模型GLM-Realtime是一款由智谱推出的先进端到端多模态模型,具备低延迟的视频理解和语音交互功能,独特地加入了清唱能力,使得大模型在对话中展……
Step R-mini
StepR-mini阶跃星辰推出的Step系列首个推理模型StepR-mini是阶跃星辰推出的首款推理模型,专注于主动规划、尝试与反思,运用慢思考和验证机制,致力于为用户提供精准可靠的回答。该……
RealtimeSTT
RealtimeSTTAI实时语音转文本库,自动检测说话的开始与结束RealtimeSTT是什么RealtimeSTT是一款开源的实时语音转文本库,专为低延迟应用场景而设计。它具备强大的语音活动检测功能……
Pipecat
Pipecat构建语音和多模态对话代理的开源框架Pipecat概述Pipecat是一个开源的Python框架,旨在简化语音和多模态对话代理的构建。通过集成内置的语音识别、文本转语音(TTS)和对话处……
Luma Ray2
LumaRay2LumaAI推出的最新视频生成模型LumaRay2是什么LumaRay2是LumaAI最新推出的视频生成模型,基于全新的多模态架构进行训练,展现出卓越的功能。这一架构的计算能力是Ray1的10倍……
无需微调的推理框架,提升扩散模型生成能力首次实现8K分辨率图像
产品名称:FreeScale产品简介:FreeScale是南洋理工大学、阿里巴巴集团和复旦大学推出无需微调的推理框架,提升预训练扩散模型生成高分辨率图像和视频的能力。FreeScale基于处理和……
Make-It-Animatable:中科大与腾讯联手打造智能即时动画生成资产系统
Make-It-Animatable是由中国科学技术大学与腾讯PCG联合开发的一种数据驱动框架,能够在短短一秒钟内将任何3D人形模型转换为可用于角色动画的状态,无论其外观或姿势如何。该框架通……
Agent Laboratory
AgentLaboratoryAMD联合约翰·霍普金斯大学推出的自主科研AgentAgentLaboratory是什么AgentLaboratory是由AMD与约翰·霍普金斯大合开发的一个基于大型语言模型(LLM)的自主研究平台……
14567868