标签:AI项目和框架

NVIDIA-Ingest
NVIDIA-Ingest英伟达开源的智能文档提取及结构化工具NVIDIA-Ingest是什么NVIDIA-Ingest是由英伟达推出的一套开源微服务,专门用于解析复杂且非结构化的PDF及其他企业文档。该工具能……
Nemotron-CC
Nemotron-CC英伟达推出的大型预训练数据集Nemotron-CC是什么Nemotron-CC是NVIDIA团队开发的一款大型预训练数据集,旨在将CommonCrawl的数据转化为适合长序列模型训练的高质量语料。……
MiniCPM-o 2.6
MiniCPM-o2.6面壁智能开源的多模态大模型,性能媲美GPT-4oMiniCPM-o2.6是MiniCPM-o系列中最新、性能卓越的多模态大模型,拥有8B的参数量。该模型在视觉、语音以及多模态直播等多个……
moonshot-v1-vision-preview
moonshot-v1-vision-preview月之暗面推出的多模态图片理解模型moonshot-v1-vision-preview是一款由月之暗面推出的先进多模态图像理解模型。该模型在moonshot-v1系列的基础上,进一……
Titans
Titans谷歌推出的新型神经记忆架构Titans是什么Titans是谷歌推出的一种创新型神经网络架构,旨在解决Transformer在处理长序列数据时面临的记忆限制问题。它通过引入神经长期记忆模……
星火语音同传大模型
星火语音同传大模型科大讯飞推出的端到端语音同传大模型星火语音同传大模型是什么星火语音同传大模型是科大讯飞于2025年1月15日推出的国内首个具有端到端语音同传能力的大型模型。……
讯飞星火 X1
讯飞星火X1科大讯飞推出的深度推理模型讯飞星火X1是科大讯飞于2025年1月15日推出的国内首款基于全国产算力平台训练的深度思考与推理能力兼备的大型模型。这款模型在解题过程中模拟……
ViewCrafter
ViewCrafter是一种由北京大学与香港中文大合腾讯研发的前沿视频扩散模型,能够从单张或少量图片中生成高保真度的新视角。它结合了视频扩散模型的生成优势和基于点的三维表示,能够……
Motion Dreamer
MotionDreamer香港科技大学推出的合理视频生成框架MotionDreamer是什么MotionDreamer是由香港科技大学(广州)研究团队开发的一种视频生成框架,专注于创造合理的视频内容。该框架……
Perception-as-Control
Perception-as-Control阿里通义实验室推出的图像动画框架Perception-as-Control是什么Perception-as-Control是阿里巴巴通义实验室推出的一种先进图像动画框架,旨在根据用户的需求……
123468