标签:AI项目和框架

DiTCtrl
DiTCtrl港中文联合腾讯等机构推出的多提示视频生成方法DiTCtrl是什么DiTCtrl是一种创新的多提示视频生成方法,基于多模态扩散变换器(MM-DiT)架构,由香港中文大学与腾讯等机构联……
联通元景
联通元景中国联通AI开源的中文原生文生图模型联通元景是什么联通元景(UniT2IXL)是由中国联通AI团队开发的一款中文原生文生图模型,专门在国产昇腾AI基础软硬件平台上进行训练与推……
Perplexica:智能开源AI搜索引擎实现多模式搜索与实时信息更新
Perplexica是一款开源的AI驱动搜索引擎,旨在为用户提供精准的信息检索体验。作为PerplexityAI的开源替代品,Perplexica利用机器学习和自然语言处理技术,深入理解用户的查询意图,……
AniDoc:自动化草图到彩色动画转化的创新视频扩散模型
AniDoc是一款由香港科技大学、蚂蚁集团、学、浙江大学和香港大合开发的先进AI模型,旨在简化2D动画的上色过程。该模型利用视频扩散技术,能够自动将草图序列转化为色彩丰富的动画,……
OpenAI o3:OpenAI推出超强推理模型,智能提升与创新思维的完美结合
OpenAIo3是一款新一代推理模型,具备接近通用人工智能(AGI)的能力,推出了o3和o3-mini两个版本。o3在ARC-AGI基准测试中取得了87.5%的优异成绩,远超人类平均水平。在数学和编程领……
RWKV-7:RWKV系列大模型架构提升上下文学习能力的创新产品特性解析
RWKV-7是RWKV系列最新的大型模型架构,超越了传统的注意力机制和线性注意力范式,展现出更灵活的状态演化能力,使其能够在相同的计算资源下解决以往注意力机制无法解决的问题。RWKV……
INFP:基于音频驱动的真实感面部表情与头部姿态生成AI框架
INFP是一种音频驱动的头部生成框架,专为双人对话交互而设计,能够在对话音频的引导下自动进行角色的转换,无需手动干预。该框架由两个阶段组成:基于动作的头部模仿阶段和音频引导……
PromptWizard:智能提示词优化框架提升AI交互效率与精准度
PromptWizard简介PromptWizard是微软推出的一款自动化提示优化框架,旨在提升大型语言模型(LLMs)在特定任务中的表现。通过自我演变和自我适应机制,PromptWizard利用反馈驱动的批……
StyleStudio:融合参考图像风格与文本提示的创新创作工具
StyleStudio是什么StyleStudio是由西湖大学AI实验室、复旦大学、南洋理工大学以及香港科技大学(广州)联合开发的文本驱动风格迁移模型。该模型能够将参考图像的风格与用户提供的文……
ElevenLabs Flash
ElevenLabsFlashElevenLabs推出的低延迟语音合成模型ElevenLabsFlash是一款由ElevenLabs推出的低延迟语音合成模型,专为快速响应的对话型人工智能而设计。其提供的Flashv2版本支持……
1394041424368