标签:AI项目和框架

Maya:全球领先的智能家居助手提升生活便利性与安全性
Maya是一个开源的多语言多模态模型,旨在增强其在多种语言和文化背景下的应用能力。该模型基于LLaVA框架,采用新开发的预训练数据集,涵盖八种语言,旨在提升视觉和语言任务中的文……
AI 漫画生成框架,能生成可控的黑白漫画面板
产品名称:DiffSensei产品简介:DiffSensei是北京大学、上海AI实验室及南洋理工大学的研究人员共同推出的漫画生成框架,能生成可控的黑白漫画面板。DiffSensei整合基于扩散的图像生……
苹果推出的视频生成大模型
产品名称:STIV产品简介:STIV(ScalableTextandImageConditionedVideoGeneration)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本到视频(T2V)和文本图像到视频……
SynCamMaster:多视角视频生成模型引领视频创作新纪元
SynCamMaster是由浙江大学、快手科技、清华大学和香港中文大学的研究团队联合开发的全球首款多视角视频生成模型。该模型结合6自由度相机姿态,能够从任意视点生成开放世界视频。Syn……
用于测试不同LLM编程能力的在线平台
产品名称:CodeArena产品简介:CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主要评估和……
谷歌推出支持多模态交互、低延迟实时互动的AI接口
产品名称:MultimodalLiveAPI产品简介:MultimodalLiveAPI是谷歌推出的低延迟、双向交互的AI接口,支持文本、音频和视频输入,用音频和文本形式输出,能帮助开发者构建具有实时音频……
AI 聊天客户端,基于 MCP 支持多语言和自动化安装
产品名称:ChatMCP产品简介:ChatMCP是基于模型上下文协议(MCP)的AI聊天客户端,支持与各种大型语言模型(LLM)如OpenAI、Claude和OLLama等进行交互。ChatMCP具备自动化安装MCP服……
AI文本引导图像编辑框架,0.23秒内实现高质量的图像编辑
产品名称:SwiftEdit产品简介:SwiftEdit是由VinAIResearch团队推出的文本引导的图像编辑工具,基于创新的一步扩散技术,能在0.23秒内实现快速且高质量的图像编辑。工具的核心优势……
轻量级LLM应用开发框架,通过一行代码切换不同LLM
产品名称:Promptic产品简介:Promptic是轻量级的LLM应用开发框架,提供高效且符合Python风格的开发方式。基于LiteLLM,Promptic支持开发者能轻松切换不同的LLM服务提供商,只需更……
ReplaceAnything
ReplaceAnything是一款由阿里巴巴智能计算研究院推出的开源AI图像内容替换框架,利用尖端人工智能技术,实现对图像中物体的智能替换。用户只需简单操作,框选需要保留的图像部分,……
1505152535468