标签:AI项目和框架

SPDL:高效便捷的开源AI模型数据加载解决方案助力深度学习创新
SPDL(ScalableandPerformantDataLoading)是由MetaAI开发的一款开源数据加载工具,旨在显著提升AI模型的训练效率。该工具基于多线程技术,能够实现高吞吐量的数据加载,同时降低计……
AI视频修复处理工具,修复缺失、支持四倍超分辨率
产品名称:VISIONXL产品简介:VISIONXL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊,显著提升视频清晰……
TeleAI 视频生成大模型:智能视频创作助手助力内容创作与传播
TeleAI视频生成大模型是中国电信AI研究院推出的一款先进视频生成工具,采用创新的两阶段生成框架。该模型首先根据用户提供的文本描述绘制分镜头草图,随后基于该草图生成完整视频。……
Luma Photon:创新图像生成模型助力无限创意与高效创作
LumaPhoton是LumaAI最新推出的图像生成模型,凭借其创新的架构,提供了超高的图像质量和经济高效的生成能力。它能够支持个性化和创意丰富的图像生成,理解自然语言指令,并实现多轮……
GenCast:DeepMind推出的革命性AI气象预测模型提升天气预报精准度与效率
GenCast是DeepMind推出的一款先进的AI气象预测模型,基于扩散模型技术,能够提供长达15天的全球天气预报。该模型在97.2%的预测任务中超过了国际顶尖的中期天气预报系统ENS,特别是……
Micro LLAMA:探索LLAMA 3模型的核心原理与应用特点
MicroLLAMA是一个精简的教学版LLAMA3模型实现,旨在帮助学习者深入理解大型语言模型的架构。项目代码仅约180行,使得复杂的模型结构变得易于学习和掌握。MicroLLAMA采用的是LLAMA3……
Perplexideez:智能信息追溯助手提升搜索效率与准确性
Perplexideez是一款本地AI助手,旨在帮助用户在网络及自托管应用中迅速获取所需信息。它基于Postgres数据库,支持Ollama或OpenAI兼容的接口,并利用SearXNG实例进行网络搜索。Perpl……
Fish Audio 推出的语音合成模型,支持13种语言
产品名称:FishSpeech1.5产品简介:FishSpeech1.5是FishAudio推出的文本到语音(TTS)模型,基于深度学习技术如Transformer、VITS、VQVAE和GPT等。FishSpeech1.5支持英语、日语、韩……
Motion Prompting:谷歌携手密歇根与布朗大学推出创新运动轨迹控制视频生成模型
MotionPrompting是一种由GoogleDeepMind、密歇根大学和布朗大学联合开发的视频生成技术。该技术基于运动轨迹的控制,能够灵活地指导视频内容的生成。用户可以通过设计“运动提示”,……
字节豆包联合M-A-P社区开源的全新代码评估基准
产品名称:FullStackBench产品简介:FullStackBench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStackBench覆盖超……
1596061626368