AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
VisionFM
VisionFM通用眼科AI大模型,具备少样本多种疾病诊断能力VisionFM(伏羲慧眼)是一款先进的多模态多任务视觉基础模型,专门为通用眼科人工智能而研发。该模型通过对340万张来自560,4……
INFP
INFP音频驱动的生成逼真面部表情和头部姿态的AI框架INFP是什么INFP是一个音频驱动的头部生成框架,专门为双人对话交互而设计。该框架能够根据对话音频自动进行角色转换,无需手动分……
Gemini 2.0 Flash Thinking:探索谷歌最新实验性推理模型的核心特性与应用潜力
Gemini2.0FlashThinking是什么Gemini2.0FlashThinking是谷歌推出的一款创新性实验性AI模型,旨在迅速思考并解决各种问题。与OpenAI的o1模型相比,Gemini2.0FlashThinking不仅给出结……
AniDoc
AniDoc2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画AniDoc是什么AniDoc是由香港科技大学、蚂蚁集团、学、浙江大学和香港大合研发的一款先进的2D动画上色AI模型……
ElevenLabs Flash:创新低延迟语音合成模型提升语音交互体验
ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为需要快速响应的对话型AI应用设计。该产品分为两个版本:Flashv2支持英语,而Flashv2.5则扩展至32种语言。与其他……
EMMA-X:具身多模态动作模型推动人机交互的革新与应用
EMMA-X是一款由新加坡科技设计大学开发的具身多模态动作模型,拥有70亿参数,旨在提升机器人在复杂环境中的任务执行能力。该模型基于有根据的链式思维(CoT)推理数据,对OpenVLA进……
AI 3D世界生成模型,文本图像秒变3D渲染场景
产品名称:Explorer产品简介:Explorer是Odyssey公司推出的生成性世界模型,能将任何图像转化为详细的3D世界。Explorer模型擅长生成真实感世界,且支持动态效果的生成。Explorer基……
X-AnyLabeling:多样化图像与视频标注样式的智能AI工具
X-AnyLabeling是一款先进的图像标注软件,集成了多种深度学习算法,致力于显著提高标注的效率与准确性。它能够处理多种标注样式,适用于图像和视频的标注需求,覆盖多个AI训练场景……
UniReal:港大携手Adobe推出创新图像生成与编辑框架提升创作效率与灵活性
UniReal是一款由香港大学与Adobe研究院联合开发的创新框架,旨在实现多种图像生成与编辑任务。该框架基于对现实世界动态的模拟,能够在一个统一模型中处理图像生成、编辑、定制和合……
Genesis:开源生成式物理引擎助力创新模拟与实时交互体验
产品名称:Genesis核心观点:Genesis是由卡内基梅隆大学、马里兰大学、斯坦福大学和麻省理工学院等知名研究机构联合开发的开源生成式物理引擎,旨在以简单的语言快速生成精确的物理……