AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
标签:模型压缩
ViT作者飞机上也要读的改进版Transformer论文,花2个小时详细批注解读分享出来
质疑微软,理解微软原标题:ViT作者飞机上也要读的改进版Transformer论文,花2个小时详细批注解读分享出来文章来源:量子位内容字数:3875字LucasBeyer点评微软DifferencialTransfo……
突破极限:LLM能力密度惊人翻倍的Densing法则揭秘
大模型不仅有ScalingLaw,还有DensingLaw原标题:LLM最大能力密度100天翻一倍!清华刘知远团队提出DensingLaw文章来源:机器之心内容字数:5265字大模型的发展趋势:ScalingLaw与De……
颠覆传统:腾讯优图与中科大携手推出全新模型知识蒸馏SOTA!
一种基于Sinkhorn距离的知识蒸馏方法原标题:模型知识蒸馏新SOTA!告别传统散度蒸馏|腾讯优图&中科大出品文章来源:量子位内容字数:6619字基于Sinkhorn距离的知识蒸馏新方法S……
12