标签:AI工具

开源漫画图片字翻译工具,多语言翻译无缝嵌入原图
产品名称:MangaImageTranslator产品简介:MangaImageTranslator是开源的漫画图片字翻译工具,能一键翻译漫画和图片中的字。MangaImageTranslator基于OCR技术识别本,结合机器翻译……
Databricks SQL:智能数据仓库助力企业高效数据处理与分析
DatabricksSQL是一款由Databricks提供的智能数据仓库服务,旨在通过DatabricksIQ(数据智能引擎)深入理解用户数据的独特性,进而为技术和业务用户提供直观易用的数据分析体验。它……
谷歌推出的评估大模型能力的基准测试
产品名称:FACTSGrounding产品简介:FACTSGrounding是谷歌DeepMind推出的评估大型语言模型(LLMs)能力的基准测试,衡量模型根据给定上下生成事实准确且无捏造信息的本的能力。FACT……
豆包推出3D生成模型,自然语言交互实时生成3D场景图
产品名称:豆包3D生成模型产品简介:豆包3D生成模型是豆包推出的3D生成模型,属于豆包大模型家族。模型基于3D-DiT架构,能生成高质量3D模块。与火山引擎数字孪生台veOmniverse结合……
MV-Adapter:多视图一致图像生成模型的创应用与技术优势
MV-Adapter是一款多视图一致性图像生成模型,由北京航航天大学、VAST和上交通大学的研究团队联合开发。该模型能够将预训练的本到图像扩散模型转变为多视图图像生成器,而无需对原有……
豆包推出视觉理解模型,具备识别和推理能力
产品名称:豆包视觉理解模型产品简介:豆包视觉理解模型是豆包推出的先进AI大模型,具备视觉识别和理解推理能力。豆包视觉理解模型能识别图像中物体的类别、形状、纹理等,还能理解……
微软开源的多功能、多格式档转Markdown工具
产品名称:MarkItDown产品简介:MarkItDown是微软开源的多功能档处理工具,能将PDF、PPT、Word、Excel、图像、音频、HTML等多种格式的件转换成Markdown格式。支持OCR字识别、语音转……
知作:智能创作助手,集灵感搜索与视频编辑于一体的多功能台
知作是什么知作是一款先进的智能内容创作台,致力于为用户提供灵感探索、AI创作以及团队协作等多种功能。台的特色工具包括AI图片生成、视频分镜设计和魔法编辑,旨在帮助用户高效创……
Allegro
Allegro是由RhymesAI推出的一款创的本转视频生成模型,能够将简洁的字输入转化为高达720p分辨率、每秒15帧、最长6秒的高质量视频内容。该模型在视频生成域表现卓越,展现出优秀的质……
Excalidraw:实时协作的手绘风格在线白板工具
Excalidraw是什么Excalidraw是一款开源的在线绘图工具,以其独特的手绘风格和大的实时协作功能而闻名。该工具无需安装,可以直接在浏览器中使用,支持多人同时在同一画布上进行编辑……
19495969798132