AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:AI项目和框架
GenCast:DeepMind推出的革命性AI气象预测模型提升天气预报精准度与效率
GenCast是DeepMind推出的一款先进的AI气象预测模型,基于扩散模型技术,能够提供长达15天的全球天气预报。该模型在97.2%的预测任务中超过了国际顶尖的中期天气预报系统ENS,特别是……
Micro LLAMA:探索LLAMA 3模型的核心原理与应用特点
MicroLLAMA是一个精简的教学版LLAMA3模型实现,旨在帮助学习者深入理解大型语言模型的架构。项目代码仅约180行,使得复杂的模型结构变得易于学习和掌握。MicroLLAMA采用的是LLAMA3……
Perplexideez:智能信息追溯助手提升搜索效率与准确性
Perplexideez是一款本地AI助手,旨在帮助用户在网络及自托管应用中迅速获取所需信息。它基于Postgres数据库,支持Ollama或OpenAI兼容的接口,并利用SearXNG实例进行网络搜索。Perpl……
Fish Audio 推出的语音合成模型,支持13种语言
产品名称:FishSpeech1.5产品简介:FishSpeech1.5是FishAudio推出的文本到语音(TTS)模型,基于深度学习技术如Transformer、VITS、VQVAE和GPT等。FishSpeech1.5支持英语、日语、韩……
Motion Prompting:谷歌携手密歇根与布朗大学推出创新运动轨迹控制视频生成模型
MotionPrompting是一种由GoogleDeepMind、密歇根大学和布朗大学联合开发的视频生成技术。该技术基于运动轨迹的控制,能够灵活地指导视频内容的生成。用户可以通过设计“运动提示”,……
字节豆包联合M-A-P社区开源的全新代码评估基准
产品名称:FullStackBench产品简介:FullStackBench是字节跳动豆包大模型团队与M-A-P社区联合推出的全新代码评估基准,专注于全栈编程和多语言编程能力评估。FullStackBench覆盖超……
ClearerVoice-Studio:智能语音处理框架助力多场景应用的高效解决方案
ClearerVoice-Studio是阿里巴巴达摩院通义实验室推出的一款开源语音处理框架,专注于语音增强、分离以及音视频说话人提取等技术。该框架利用复数域深度学习算法,有效消除背景噪声……
哈工大联合鹏城实验室推出的智能体框架
产品名称:Optimus-1产品简介:Optimus-1是哈尔滨工业大学(深圳)和鹏城实验室推出的智能体框架,能解决在开放世界环境中完成长期任务的挑战。框架结合结构化知识和多模态经验,让……
PaliGemma 2:DeepMind推出革命性视觉语言模型,实现跨媒体理解与生成
PaliGemma2是GoogleDeepMind推出的最新一代视觉语言模型(VLM),基于Gemma2语言模型家族,作为PaliGemma的升级版本。它结合了SigLIP-So400m视觉编码器和不同规模的Gemma2模型,能……
TensorOpera 开源的小语言模型系列
产品名称:Fox-1产品简介:Fox-1是TensorOpera推出的一系列小型语言模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3万亿个网络抓取的文档数据上预训练,在5……