AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
产品名称:Amurex产品简介:Amurex是AI会议助手,基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能,帮助用户提升会议效率。作为开源工具,Amurex强调透明……
GenMAC:多代理协作框架推动文本到视频生成技术的创新与应用
GenMAC是什么GenMAC是由香港大学、清华大学和微软研究院联合开发的一个多代理协作迭代框架,旨在解决复杂的文本到视频生成问题。该框架将生成任务划分为设计、生成和重新设计三个阶……
Adobe 联合 MIT 推出的自回归实时视频生成技术
产品名称:CausVid产品简介:CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延……
SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新
SPDL(ScalableandPerformantDataLoading)是由MetaAI开发的一款开源数据加载工具,旨在显著提升AI模型的训练效率。该工具基于多线程技术,能够实现高吞吐量的数据加载,同时降低计……
AI视频修复处理工具,修复缺失、支持四倍超分辨率
产品名称:VISIONXL产品简介:VISIONXL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊,显著提升视频清晰……
Stable Video 3D (SV3D)
StableVideo3D(SV3D)是一款由StabilityAI开发的尖端3D技术,它能够从单张图片生成一致且高质量的多视角图像和3D网格。基于先前的StableVideoDiffusion模型,SV3D在质量和多视角体……
智谱 AI 免费开放图像理解大模型
产品名称:GLM-4V-Flash产品简介:GLM-4V-Flash是智谱AI推出的专注于图像理解的AI模型,提供免费的API接口,支持用户上传图片URL或Base64编码图片获取详细的图像描述。模型简化图像……
One Shot, One Talk:中科大与香港理工携手打造创新动态图像生成技术,实现实时创作与智能化设计
OneShot,OneTalk是前沿的图像生成技术,能够从单张图片中创造出具有个性化细节的全身动态说话头像。该技术实现了生动的动画效果,包括自然的面部表情与灵活的身体动作,致力于提升……
xAI为Grok AI助手推出的新图像生成模型
产品名称:Aurora产品简介:Aurora是xAI为AI助手Grok新增的图像生成模型。Aurora擅长创建逼真的图像,擅长人物肖像。Aurora能生成包括公共和版权人物在内的图像(如米老鼠)。Auror……
音频驱动的生成肖像说话视频框架,保持身份一致性和表现力
产品名称:MEMO产品简介:MEMO(Memory-GuidedEMOtionawarediffusion)是SkyworkAI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的……