标签:AI项目和框架

ClearerVoice-Studio:智能语音处理框架助力多场景应用的高效解决方案
ClearerVoice-Studio是阿里巴巴达摩院通义实验室推出的一款开源语音处理框架,专注于语音增强、分离以及音视频说话人提取等技术。该框架利用复数域深度学习算法,有效消除背景噪声……
哈工大联合鹏城实验室推出的智能体框架
产品名称:Optimus-1产品简介:Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让……
PaliGemma 2:DeepMind推出革命性视觉语言模型,实现跨媒体理解与生成
PaliGemma2是GoogleDeepMind推出的最新一代视觉语言模型(VLM),基于Gemma2语言模型家族,作为PaliGemma的升级版本。它结合了SigLIP-So400m视觉编码器和不同规模的Gemma2模型,能……
TensorOpera 开源的小语言模型系列
产品名称:Fox-1产品简介:Fox-1是TensorOpera推出的一系列小型语言模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练,在5……
Meta AI推出的纯文本语言模型
产品名称:Llama3.3产品简介:Llama3.3是MetaAI推出的70B参数模型,大型多语言预训练语言模型,性能与40B参数的Llama3.1相当。模型专为多语言对话优化,支持英语、德语、法语、意大……
MiniCPM-V
MiniCPM-V是一款由面壁智能开发的开源多模态大模型,拥有80亿个参数,专注于图像与视频的理解。该模型在单幅图像的解析能力上超越了诸如GPT-4V等其他同类模型,并首次实现了在iPad……
Meta AI推出的纯文本语言模型
产品名称:Llama3.3产品简介:Llama3.3是MetaAI推出的70B参数模型,大型多语言预训练语言模型,性能与40B参数的Llama3.1相当。模型专为多语言对话优化,支持英语、德语、法语、意大……
FLUX.1
FLUX.1是由StableDiffusion创始团队推出的领先开源AI图像生成模型,以其12B参数成为目前最大规模的文本到图像模型。FLUX.1提供三种版本,分别是具备顶级性能的FLUX.1[pro]、适用于……
TeleAI 视频生成大模型:智能视频创作助手助力内容创作与传播
TeleAI视频生成大模型是中国电信AI研究院推出的一款先进视频生成工具,采用创新的两阶段生成框架。该模型首先根据用户提供的文本描述绘制分镜头草图,随后基于该草图生成完整视频。……
Luma Photon:创新图像生成模型助力无限创意与高效创作
LumaPhoton是LumaAI最新推出的图像生成模型,凭借其创新的架构,提供了超高的图像质量和经济高效的生成能力。它能够支持个性化和创意丰富的图像生成,理解自然语言指令,并实现多轮……
1606162636468