Qwen3
Qwen3 是由阿里云 Qwen 团队开发的大型语言模型系列。
ComfyUI+LoRA[色孽]
通过ComfyUI工作流生成色孽风格的图像
ComfyUI+LoRA[薇尔莉特]
通过ComfyUI工作流生成薇尔莉特风格的图像
HiDream-I1
拥有17B参数的新型开源图像生成模型,能够在几秒钟内实现最先进的图像生成质量。
查天气MCP
用于查询中国城市的天气
抓取网页MCP
用于轻松获取和转换网页内容为多种格式(HTML、JSON、Markdown、纯文本)
Geoapify MCP
将地址转换为 GPS 坐标以进行映射,并可选择使用 Geoapify 服务器创建这些坐标的图像。
艺术探索MCP
提供对 Rijksmuseum 收藏品的访问,允许 AI 模型探索、分析和与艺术品及收藏进行互动。
搜图MCP
一个用于 Unsplash 图像搜索的 MCP Server
高德地图MCP
高德地图官方 MCP Server
AI绘图MCP
基于Flux.1-dev为对话模型提供生成图片的能力
联网搜索MCP
搜索引擎,支持搜索与信息提取功能。
SkyReels-V1
SkyReels-V1是中国面向AI短剧创作的视频生成模型。
SkyReels-A1
中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
万相2.1
阿里巴巴开源的视频生成模型
DeepSeek-R1-Distill
DeepSeek-R1-Distill是DeepSeek-R1的蒸馏小参数模型,在保持性能的同时降低了资源消耗。
AniPortrait
音频驱动的肖像动画合成框架,能够根据音频和静态人脸图片生成逼真的动态视频。
RAGFlow
为各种规模的企业及个人提供一套精简的RAG工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
Flowise
低代码工具,供开发人员构建定制的LLM编排流程和AI Agent。
FastGPT
开源 AI 知识库构建平台。提供了开箱即用的数据处理、模型调用、RAG 检索、可视化 AI 工作流编排等能力,帮助您轻松构建复杂的 AI 应用。
Dify
提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。
Stable Video Diffusion
支持以图像或文本提示作为输入,输出长达4秒的平滑、多帧视频片段。
LivePortrait
将静态照片或图像转换为动态视频。它能够准确、实时地将驱动视频中的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。
SadTalker
SadTalker能够将一张静态的肖像图片和一段音频融合,通过AI生成一个逼真的说话头像视频,仿佛让一张照片变得“会说话”。
Paints-UNDO
基于AI的绘画过程生成工具,能够自动生成图像的绘画过程视频。
CogVideo
AI 驱动视频生成解决方案,其核心技术依托于前沿的深度学习算法和模型架构。
MockingBird
AI拟声应用,5秒内克隆您的声音并生成任意语音内容。
F5-TTS
支持跨语言语音克隆(比如用英语说话人的声音说中文)、语速控制、零样本语音生成(不需要针对新说话人重新训练)、多种语音类型合成、长文本语音生成等功能。
FishSpeech
文本转语音工具,它通过大量的数据训练,能够生成接近人类水平的语音。
CosyVoice
基于语音量化编码的语音生成大模型,能够深度融合文本理解和语音生成,实现自然流畅的语音生成体验。
RVC
基于VITS技术的革新性语音转换框架,专为追求声音变换极致体验的用户精心打造。
GPT-SoVITS
即使没有直接的训练数据,模型仍能生成相似风格的语音。
ChatTTS_colab
基于 ChatTTS ,支持流式输出、音色抽卡、长音频生成和分角色朗读。
ChatTTS
专为对话场景设计的文本到语音(TTS)模型,特别适用于大型语言模型(LLM)助手的对话任务、对话式音频和视频介绍等应用场景。
oobabooga-webui
适用于大型语言模型的Gradio Web UI。
Ollama Open WebUI
用于在本地运行大型语言模型(LLM)的开源Web界面。本应用已对接Ollama。
Ollama
大语言模型服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛
InstantID
一张照片,无需训练,秒级个人写真生成。
PuLID
PuLID能够在单张参考图像的基础上,快速生成具有高度个性化特征的图像和视频。
FaceFusion
AI换脸软件,适用于图片和视频的换脸操作。它提供了简洁的用户界面,使得操作简单易懂,即使是初学者也能轻松上手。
SD-Trainer
Stable Diffusion进行微调训练的WebUI,上传少量图片,可以方便的训练出新的SD模型,生成期望的图片风格。
Fluxgym
专为FLUX Lora模型训练设计的工具,其最大亮点在于极低的硬件要求和简便的使用方法。
Omost
一句话即可AI绘画,自动生成关键词,通过简单文本描述生成逼真图像。
FaceChain
生成保留身份特征的人像,仅需一张照片和10几秒钟,就可以生成不同风格的个人形象。
PhotoMaker
AI 照片编辑和生成工具。无需训练 LoRA,只需上传几张人物照片,即可生成多种风格且逼真的人物图像。
IOPaint
图像修复工具,只需简单涂抹便可以编辑图片,从而实现图像抹除、对象替换等功能。
Fooocus
支持高质量文本到图像转换,简化操作
Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge 是一个构建在 Stable Diffusion WebUI 之上的平台
Stable Diffusion WebUI
一种基于深度学习的文本到图像生成模型
ComfyUI
ComfyUI是一款基于节点工作流稳定扩散算法的图形界面。