AI快讯

共同一作为MSRA实习生、北大er原标题：让Qwen2.57B超越o1，微软干的！MSRA推出小模型数学推理自我进化新方法文章来源：智猩猩GenAI内容字数：8751字微软rStar-Math算法：赋能小模型……

10个月前

汇总Llama3.1、DeepSeek-V3、TÜLU3和Qwen2.5的后训练Post-Training技术。原标题：从Llama3.1到DeepSeek-V3，大模型Post-Training总结！文章来源：智猩猩GenAI内容字数：14490字Llam……

10个月前

AIGC动态欢迎阅读原标题：Gemma2成最强开源模型，力压Llama3！但榜单prompt微调引争议关键字：报告,解读,模型,数据,赛道文章来源：FounderPark内容字数：0字内容摘要：文章转自「新……

10个月前

AIGC动态欢迎阅读原标题：ScalingLaw撞南墙，MIT发现另一条路：测试时训练，推理能力最高升至5.8倍关键字：测试,模型,任务,样本,数据文章来源：夕小瑶科技说内容字数：0字内容摘要……

10个月前

来自当年百度硅谷人工智能实验室(SVAIL)系统团队原标题：ScalingLaw百度最早提出？！OpenAI/Claude都受它启发，Ilya出现在致谢名单中文章来源：量子位内容字数：4717字ScalingLaw的……

10个月前

AIGC动态欢迎阅读原标题：年底手握60万块GPU！扎克伯格宣战AGI，血拼谷歌OpenAI关键字：元宇宙,智能,模型,公司,人才文章来源：智东西内容字数：7748字内容摘要：正在训练Llama3，对……

10个月前

Durable是一款创新的人工智能网站构建器，旨在帮助小型企业和个人创业者轻松地将业务转移到线上。用户无需编写代码，仅需短短30秒便可创建出专业的网站。此外，Durable集成了强大的……

10个月前

AIGC动态欢迎阅读原标题：如何从零训练多模态大模型（预训练方向）关键字：知乎,侵权,数据,阶段,指令文章来源：智猩猩GenAI内容字数：0字内容摘要：开讲预约导读原文来自知乎，作者……

10个月前

本期通讯24617字，可免费试读至8%。原标题：NoMoreNext-TokenPrediction？文章来源：机器之心内容字数：3742字AI与机器人领域的三大要事解读本文对机器之心PRO会员通讯Week02中提到……

10个月前

目标是开发「通用」、「自适应」和「多功能」的机器人原标题：OpenAI被曝重组机器人团队，4年前缺钱缺数据，如今要做硬件布局了文章来源：机器之心内容字数：5688字OpenAI重启机器……

10个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐