AI快讯

AI快讯

让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
共同一作为MSRA实习生、北大er原标题:让Qwen2.57B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法文章来源:智猩猩GenAI内容字数:8751字微软rStar-Math算法:赋能小模型……
从Llama3.1到DeepSeek-V3,大模型Post-Training总结!
汇总Llama3.1、DeepSeek-V3、TÜLU3和Qwen2.5的后训练Post-Training技术。原标题:从Llama3.1到DeepSeek-V3,大模型Post-Training总结!文章来源:智猩猩GenAI内容字数:14490字Llam……
Gemma 2成最强开源模型,力压 Llama 3!但榜单prompt微调引争议
AIGC动态欢迎阅读原标题:Gemma2成最强开源模型,力压Llama3!但榜单prompt微调引争议关键字:报告,解读,模型,数据,赛道文章来源:FounderPark内容字数:0字内容摘要:文章转自「新……
Scaling Law撞南墙,MIT发现另一条路:测试时训练,推理能力最高升至5.8倍
AIGC动态欢迎阅读原标题:ScalingLaw撞南墙,MIT发现另一条路:测试时训练,推理能力最高升至5.8倍关键字:测试,模型,任务,样本,数据文章来源:夕小瑶科技说内容字数:0字内容摘要……
突破极限:Scaling Law如何重塑人工智能的未来
来自当年百度硅谷人工智能实验室(SVAIL)系统团队原标题:ScalingLaw百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中文章来源:量子位内容字数:4717字ScalingLaw的……
年底手握60万块GPU!扎克伯格宣战AGI,血拼谷歌OpenAI
AIGC动态欢迎阅读原标题:年底手握60万块GPU!扎克伯格宣战AGI,血拼谷歌OpenAI关键字:元宇宙,智能,模型,公司,人才文章来源:智东西内容字数:7748字内容摘要:正在训练Llama3,对……
Durable
Durable是一款创新的人工智能网站构建器,旨在帮助小型企业和个人创业者轻松地将业务转移到线上。用户无需编写代码,仅需短短30秒便可创建出专业的网站。此外,Durable集成了强大的……
如何从零训练多模态大模型(预训练方向)
AIGC动态欢迎阅读原标题:如何从零训练多模态大模型(预训练方向)关键字:知乎,侵权,数据,阶段,指令文章来源:智猩猩GenAI内容字数:0字内容摘要:开讲预约导读原文来自知乎,作者……
No More Next-Token Prediction?
本期通讯24617字,可免费试读至8%。原标题:NoMoreNext-TokenPrediction?文章来源:机器之心内容字数:3742字AI与机器人领域的三大要事解读本文对机器之心PRO会员通讯Week02中提到……
OpenAI被曝重组机器人团队,4年前缺钱缺数据,如今要做硬件布局了
目标是开发「通用」、「自适应」和「多功能」的机器人原标题:OpenAI被曝重组机器人团队,4年前缺钱缺数据,如今要做硬件布局了文章来源:机器之心内容字数:5688字OpenAI重启机器……
13839404142220