AICAT ─ 全球3000+优质AI工具盘点,热门AI教程推荐
AI工具
AI工具
AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型
产品名称:Ivy-VL产品简介:Ivy-VL是AISafeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型,专为移动端和边缘设备设计。模型拥有3B参数量,相较于其他多模态大模型……
AI试卷识别处理软件,具备高清扫描、手写擦除、试卷还原等功能
产品名称:拍试卷产品简介:拍试卷是为学生和教师设计的试卷扫描和处理软件。拍试卷基于OCR(光学字符识别)技术,从图片中提取字变得快速和准确,保持原有的排版格式。拍试卷具备……
开源漫画图片字翻译工具,多语言翻译无缝嵌入原图
产品名称:MangaImageTranslator产品简介:MangaImageTranslator是开源的漫画图片字翻译工具,能一键翻译漫画和图片中的字。MangaImageTranslator基于OCR技术识别本,结合机器翻译……
Databricks SQL:智能数据仓库助力企业高效数据处理与分析
DatabricksSQL是一款由Databricks提供的智能数据仓库服务,旨在通过DatabricksIQ(数据智能引擎)深入理解用户数据的独特性,进而为技术和业务用户提供直观易用的数据分析体验。它……
谷歌推出的评估大模型能力的基准测试
产品名称:FACTSGrounding产品简介:FACTSGrounding是谷歌DeepMind推出的评估大型语言模型(LLMs)能力的基准测试,衡量模型根据给定上下生成事实准确且无捏造信息的本的能力。FACT……
豆包推出3D生成模型,自然语言交互实时生成3D场景图
产品名称:豆包3D生成模型产品简介:豆包3D生成模型是豆包推出的3D生成模型,属于豆包大模型家族。模型基于3D-DiT架构,能生成高质量3D模块。与火山引擎数字孪生台veOmniverse结合……
MV-Adapter:多视图一致图像生成模型的创应用与技术优势
MV-Adapter是一款多视图一致性图像生成模型,由北京航航天大学、VAST和上交通大学的研究团队联合开发。该模型能够将预训练的本到图像扩散模型转变为多视图图像生成器,而无需对原有……
豆包推出视觉理解模型,具备识别和推理能力
产品名称:豆包视觉理解模型产品简介:豆包视觉理解模型是豆包推出的先进AI大模型,具备视觉识别和理解推理能力。豆包视觉理解模型能识别图像中物体的类别、形状、纹理等,还能理解……
微软开源的多功能、多格式档转Markdown工具
产品名称:MarkItDown产品简介:MarkItDown是微软开源的多功能档处理工具,能将PDF、PPT、Word、Excel、图像、音频、HTML等多种格式的件转换成Markdown格式。支持OCR字识别、语音转……
百川模型冲顶中测试基准!首款AI助手“百小应”同时发布,“最懂搜索”
AIGC动态欢迎阅读原标题:百川模型冲顶中测试基准!首款AI助手“百小应”同时发布,“最懂搜索”关键字:模型,智能,能力,助手,用户章来源:量子位内容字数:9856字内容摘要:衡宇发自凹……