AI项目和框架 | 第 41 页

DiTCtrl港中文联合腾讯等机构推出的多提示视频生成方法DiTCtrl是什么DiTCtrl是一种创新的多提示视频生成方法，基于多模态扩散变换器（MM-DiT）架构，由香港中文大学与腾讯等机构联……

6个月前

联通元景中国联通AI开源的中文原生文生图模型联通元景是什么联通元景（UniT2IXL）是由中国联通AI团队开发的一款中文原生文生图模型，专门在国产昇腾AI基础软硬件平台上进行训练与推……

6个月前

Perplexica是一款开源的AI驱动搜索引擎，旨在为用户提供精准的信息检索体验。作为PerplexityAI的开源替代品，Perplexica利用机器学习和自然语言处理技术，深入理解用户的查询意图，……

6个月前

AniDoc是一款由香港科技大学、蚂蚁集团、学、浙江大学和香港大合开发的先进AI模型，旨在简化2D动画的上色过程。该模型利用视频扩散技术，能够自动将草图序列转化为色彩丰富的动画，……

7个月前

OpenAIo3是一款新一代推理模型，具备接近通用人工智能（AGI）的能力，推出了o3和o3-mini两个版本。o3在ARC-AGI基准测试中取得了87.5%的优异成绩，远超人类平均水平。在数学和编程领……

7个月前

RWKV-7是RWKV系列最新的大型模型架构，超越了传统的注意力机制和线性注意力范式，展现出更灵活的状态演化能力，使其能够在相同的计算资源下解决以往注意力机制无法解决的问题。RWKV……

7个月前

INFP是一种音频驱动的头部生成框架，专为双人对话交互而设计，能够在对话音频的引导下自动进行角色的转换，无需手动干预。该框架由两个阶段组成：基于动作的头部模仿阶段和音频引导……

7个月前

PromptWizard简介PromptWizard是微软推出的一款自动化提示优化框架，旨在提升大型语言模型（LLMs）在特定任务中的表现。通过自我演变和自我适应机制，PromptWizard利用反馈驱动的批……

7个月前

StyleStudio是什么StyleStudio是由西湖大学AI实验室、复旦大学、南洋理工大学以及香港科技大学（广州）联合开发的文本驱动风格迁移模型。该模型能够将参考图像的风格与用户提供的文……

7个月前

ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型，专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……

7个月前

1…39 404142 43…68

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐