AI项目和框架 | 第 62 页

ClearerVoice-Studio是阿里巴巴达摩院通义实验室推出的一款开源语音处理框架，专注于语音增强、分离以及音视频说话人提取等技术。该框架利用复数域深度学习算法，有效消除背景噪声……

11个月前

产品名称：Optimus-1产品简介：Optimus-1是哈尔滨工业大学（深圳）和鹏城实验室推出的智能体框架，能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验，让……

11个月前

PaliGemma2是GoogleDeepMind推出的最新一代视觉语言模型（VLM），基于Gemma2语言模型家族，作为PaliGemma的升级版本。它结合了SigLIP-So400m视觉编码器和不同规模的Gemma2模型，能……

11个月前

产品名称：Fox-1产品简介：Fox-1是TensorOpera推出的一系列小型语言模型（SLMs），包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练，在5……

11个月前

产品名称：Llama3.3产品简介：Llama3.3是MetaAI推出的70B参数模型，大型多语言预训练语言模型，性能与40B参数的Llama3.1相当。模型专为多语言对话优化，支持英语、德语、法语、意大……

11个月前

MiniCPM-V是一款由面壁智能开发的开源多模态大模型，拥有80亿个参数，专注于图像与视频的理解。该模型在单幅图像的解析能力上超越了诸如GPT-4V等其他同类模型，并首次实现了在iPad……

11个月前

产品名称：Llama3.3产品简介：Llama3.3是MetaAI推出的70B参数模型，大型多语言预训练语言模型，性能与40B参数的Llama3.1相当。模型专为多语言对话优化，支持英语、德语、法语、意大……

11个月前

FLUX.1是由StableDiffusion创始团队推出的领先开源AI图像生成模型，以其12B参数成为目前最大规模的文本到图像模型。FLUX.1提供三种版本，分别是具备顶级性能的FLUX.1[pro]、适用于……

11个月前

TeleAI视频生成大模型是中国电信AI研究院推出的一款先进视频生成工具，采用创新的两阶段生成框架。该模型首先根据用户提供的文本描述绘制分镜头草图，随后基于该草图生成完整视频。……

11个月前

LumaPhoton是LumaAI最新推出的图像生成模型，凭借其创新的架构，提供了超高的图像质量和经济高效的生成能力。它能够支持个性化和创意丰富的图像生成，理解自然语言指令，并实现多轮……

11个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐