标签:AI工具

开源的实时多模态 AI 代理框架
产品名称:TENAgent产品简介:TENAgent是集成OpenAIRealtimeAPI和RTC技术的开源实时多模态AI代理框架。TENAgent能实现语音、文本、图像的多模态交互,支持高性能的实时通信,具备低……
Midjourney 推出的多人协作 AI 虚拟世界构建工具
产品名称:Patchwork产品简介:Patchwork是Midjourney推出的创新性多人协作世界构建工具,支持用户在一个无限的画布上共同创作和构建虚拟世界。结合了AI图像生成技术和实时协作功能……
谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物
产品名称:ProjectMariner产品简介:ProjectMariner是谷歌DeepMind推出的浏览器助手。ProjectMariner基于Gemini2.0技术,用Chrome扩展程序实现浏览器自动化,理解和执行网页任务。P……
Ultravox:智能多模态助手实现文本与语音的无缝理解
Ultravox是一款创新的多模态大型语言模型(LLM),能够直接理解文本和人类语音,而无需依赖独立的自动语音识别(ASR)阶段。通过多模态投影器技术,Ultravox将音频数据转化为高维空……
星流AI:全新一站式AI图像生成平台助力创意无限探索
星流AI是LiblibAI推出的一款综合性AI图像生成平台,基于创新的Star-3通用图像生成模型,整合了全球最大的LoRA增强模型库以及尖端的AI图像控制技术。该平台旨在为设计师、摄影师和影……
AutoGLM
AutoGLM是一款由智谱AI团队最新开发的“PhoneUse”智能体,旨在通过图形用户界面(GUI)完成自主任务。它能够模仿人类在手机上的操作,处理社交媒体互动、在线购物、酒店预订等多种任……
designtools.ai
designtools.ai是一个专为设计师量身定制的在线平台,汇聚了一系列高效的人工智能工具,旨在提升UI和网页设计师的工作效率与创造力。平台提供了多种AI驱动的设计工具,如Pebblely、……
Stable Video 3D (SV3D)
StableVideo3D(SV3D)是一款由StabilityAI开发的尖端3D技术,它能够从单张图片生成一致且高质量的多视角图像和3D网格。基于先前的StableVideoDiffusion模型,SV3D在质量和多视角体……
AI浏览器插件,一键翻译国外视频用熟悉语言播放
产品名称:YouTubeDubbing产品简介:YouTubeDubbing是在线观看国外视频的浏览器插件,基于智能同步配音和AI字幕技术,对字幕进行翻译并直接将翻译后的内容播放出来,免去盯着字幕的……
AI建筑可视化平台,快速将草图或概念图转化成可视化图像
产品名称:Gendo产品简介:Gendo是AI驱动的建筑可视化平台,基于生成式AI技术,如GANs和Diffusion模型,快速创建高度逼真的建筑概念图。平台能集成到设计工作流程中,支持设计师在……
1106107108109110132