标签:数据

Meta浙大校友让评估模型「自学成才」,数据全合成无需人工标注,训练Llama 3 70B超过405B
AIGC动态欢迎阅读原标题:Meta浙大校友让评估模型「自学成才」,数据全合成无需人工标注,训练Llama370B超过405B关键字:模型,数据,指令,人类,分数文章来源:新智元内容字数:0字内……
将慢思考蒸馏进快思考,Meta 把 Llama2 跃升至 GPT-4 水平
AIGC动态欢迎阅读原标题:将慢思考蒸馏进快思考,Meta把Llama2跃升至GPT-4水平关键字:系统,模型,解读,数据,任务文章来源:FounderPark内容字数:0字内容摘要:《思考快与慢》中人……
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
AIGC动态欢迎阅读原标题:无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务关键字:数据,研究人员,任务,报告,文本文章来源:新智元内容字数:10910字内……
「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer,火爆国外
AIGC动态欢迎阅读原标题:「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer,火爆国外关键字:游戏,视频,模型,角色,数据文章来源:新智元内容字数:0字……
艾伦AI推出业界最大文本数据集,包含3万亿Tokens,超过Llama 2
迄今为止最大的开源文本数据集。编译|香草编辑|李水青智东西8月21日消息,艾伦AI研究所(AI2)于8月19日在其官方博客发布用于训练大型语言模型(LLM)的文本数据集Dolma,包含3万亿……
模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收
AIGC动态欢迎阅读原标题:模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收关键字:代币,区块,参与者,恶意,数据文章来源:机器之心内容字数:7274字内容摘要:机器之心发布机……
1232425