AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
O1-CODER:智能编码助手O1版提升开发效率与代码质量
O1-CODER是一个由北京交通大学研究团队开发的开源项目,旨在重现OpenAI的O1模型,专注于编码任务。通过结合强化学习(RL)和蒙特卡洛树搜索(MCTS)技术,O1-CODER显著增强了模型的……
英伟达推出的视觉语言大模型
产品名称:NVILA产品简介:NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统……
开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
产品名称:OOTDiffusion产品简介:OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身……
微软和马里兰大学共同开源的多模态大语言模型
产品名称:Florence-VL产品简介:Florence-VL是创新的多模态大型语言模型(MLLMs),是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉表示……
谷歌推出的最强量子芯片,成功解决30年纠错难题
产品名称:Willow量子芯片产品简介:Willow量子芯片是谷歌最新推出的具有105个物理量子比特,在量子纠错和计算效率上取得了显著突破。Willow成功解决了量子计算领域近30年的纠错难……
智源研究院开源的无标注视频学习3D生成模型
产品名称:See3D产品简介:See3D(SeeVideo,Get3D)是北京智源人工智能研究院推出的3D生成模型,能基于大规模无标注的互联网视频进行学习,实现从视频中生成3D内容。与传统依赖相……
北大健康推出的 AI 健康科普应用
产品名称:易健EasyHealth产品简介:易健EasyHealth是北京大学健康传播专业师生推出的微信小程序,基于大语言模型技术打造的健康科普智能问答系统。程序提供AI智能问答、情感智能算……
开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
产品名称:Amurex产品简介:Amurex是AI会议助手,基于实时建议、智能摘要、关键要点提取、迟到加入回顾和完整会议记录等功能,帮助用户提升会议效率。作为开源工具,Amurex强调透明……
GenMAC:多代理协作框架推动文本到视频生成技术的创新与应用
GenMAC是什么GenMAC是由香港大学、清华大学和微软研究院联合开发的一个多代理协作迭代框架,旨在解决复杂的文本到视频生成问题。该框架将生成任务划分为设计、生成和重新设计三个阶……
Adobe 联合 MIT 推出的自回归实时视频生成技术
产品名称:CausVid产品简介:CausVid是Adobe和MIT共同推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出自回归生成模型,减少视频生成的延……