AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
AI工具
AI工具
Whisk:谷歌全新AI图像生成工具助力创意无限,轻松打造精彩视觉作品
Whisk是谷歌推出的一款创新AI图像生成工具,旨在为用户提供一种简便而高效的方式来创作图像。用户只需上传图像,就能指定生成图像的主题、场景和风格,省去了复杂的文本提示。Whisk……
Apollo:Meta与斯坦福大学携手推出创新多模态模型,实现图像与文本的深度融合与理解
Apollo是Meta与斯坦福大合推出的一款大型多模态模型(LMMs),专注于提升视频理解能力。该项目通过系统研究揭示了视频理解在LMMs中的关键驱动因素,提出了“ScalingConsistency”现象……
专为电商营销领域打造的 AI 商拍工具
产品名称:潮际好麦产品简介:潮际好麦是基于AI技术为核心的电商营销平台,专为电商从业者设计。潮际好麦基于虚拟试衣、服饰换色、AI换脸和背景替换等功能,帮助用户低成本、高效率……
Meta 开源的图像生成框架,精确控制人物的外观和姿势
产品名称:Leffa产品简介:Leffa(LearningFlowFieldsinAttention)是MetaAI推出的用在可控人物图像生成框架,基于在注意力机制中引入流场学习,精确控制人物的外观和姿势。Leffa基……
Large Action Models:微软行动大模型开发框架助力高效智能应用构建与部署
LargeActionModels(LAMs)是微软推出的一款前沿开发框架,旨在创造能够在现实世界中执行复杂任务的智能系统。相比于传统的大型语言模型(LLMs),LAMs不仅具备文本生成的能力,更……
AI服装设计工具,覆盖设计核心环节款式生成、局部优化等功能
产品名称:潮际主设产品简介:潮际主设是AI时尚设计工具,专为服装设计师、时尚从业者和创意人士打造。基于AI技术赋能设计流程,从灵感生成到细节优化,提高设计效率,激发创意。潮……
图森未来推出的图生视频大模型
产品名称:Ruyi产品简介:Ruyi是图森未来科技有限公司推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、幅度控制和镜头控……
Lyra:提升多模态交互体验的SmartMore创新解决方案
Lyra是一款由香港中文大学、SmartMore和香港科技大合开发的高效多模态大型语言模型(MLLM),旨在增强语音、视觉和文本之间的交互能力。该模型利用开源的大型模型、多模态LoRA模块……
微软联合清华推出的多模态生成模型
产品名称:LatentLM产品简介:LatentLM是微软研究院和清华大学共同推出的多模态生成模型,能统一处理离散数据(如文本)和连续数据(如图像、音频)。模型用变分自编码器(VAE)将……
AI营销平台,分析数据快速生成个性化的营销活动
产品名称:ZEPIC产品简介:ZEPIC是AI驱动自动化营销平台。基于统一数据和渠道,帮助营销人员建立更深层次的客户联系。平台的核心是AI引擎Zenie,提供从数据管理到活动交付的端到端……