应用中心 - AppMall.ai - AI应用商店，提供即时交付、按需付费的人工智能应用服务。

Stable Diffusion文生视频ComfyUIDeepSeek语音克隆LoRA训练

AI绘图

Stable DiffusionComfyUI人像生成图像工具LoRA训练其他

AI对话

OllamaDeepSeek视觉识别其他

AI视频

文生视频视频合成

AI语音

TTS语音合成语音克隆

AI工具

Agent开发

MCP

精选

DeepSeek-OCR

高效且准确地将文档转化为结构化的Markdown格式

4.7

立即安装

USO

采用创新架构解决传统AI图像生成中风格与主体割裂的问题

4.3

立即安装

Step-Audio2语音对话

深度思考+音色切换

4.5

立即安装

IDM-VTON换装

提升虚拟试穿技术真实感

4.5

立即安装

FireRedTTS2

新一代对话合成模型，多语言音色克隆+工业级自然度

4.5

立即安装

IndexTTS 2

新一代工业级文本转语音（TTS）模型，语音克隆神器。

4.9

立即安装

Wan2.2

阿里巴巴开源的视频生成模型

4.8

立即安装

UniPic-2

将理解、生成、编辑三大核心能力无缝整合的“AI作图全家桶”。

4.4

立即安装

CosyVoice2

基于语音量化编码的语音生成大模型，能够深度融合文本理解和语音生成，实现自然流畅的语音生成体验。

4.7

立即安装

LatentSync

让视频中的人物口型完美地与音频同步

4.7

立即安装

FLUX.1 Kontext

多场景精准编辑，角色一致性无与伦比

4.6

立即安装

DreamO（ComfyUI）

DreamO 的 ComfyUI 原生实现

4.7

立即安装

DreamO

在单一模型中高质量支持多种图像定制任务

4.7

立即安装

MuseTalk

一键创建高质量数字人

4.6

立即安装

TRELLIS 3D模型生成

原生 3D 生成模型，支持多功能和高质量的 3D 资产创建

4.7

立即安装

Github百科MCP

获取 deepwiki.com 的最新知识，并在大模型中使用

4.3

立即安装

Context7 MCP

Context7 MCP 直接从源代码中提取最新的、特定版本的文档和代码示例，并直接放入您的提示中。

4.3

立即安装

证件照制作

支持多种用户拍照场景的识别、抠图与证件照生成。

4.6

立即安装

八字MCP

首个面向玄学领域的 MCP，针对 GPT 和 DeepSeek 等算命工具常出现的排盘错误，提供精准的八字数据，助力性格分析、命运预测等应用。

4.3

立即安装

图表MCP

一个用于生成可自定义数据可视化的MCP服务器

4.5

立即安装

GLM-4.1V-Thinking

9亿参数性能比肩72亿模型，23项评测刷新纪录，支持64K上下文与4K图像处理

4.5

立即安装

OmniGen2

支持文本生图像、图像编辑、主题驱动图像生成等多种任务

4.8

立即安装

Dia

一个 TTS 模型，能够在一次传递中生成超逼真的对话。

4.8

立即安装

趋势聚合MCP

基于MCP协议的全网热点趋势一站式聚合服务

4.8

立即安装

新闻MCP

提供来自中国主要社交平台和新闻网站实时热点话题的模型上下文协议（MCP）服务器。

4.8

立即安装

LGM(3D生成)

支持从单视角图像或文本提示生成高分辨率的三维内容

4.8

立即安装

A股数据MCP

专注于 A 股市场的 MCP，提供股票基本信息、历史 K 线数据、财务指标、宏观经济数据等多种查询功能

4.5

立即安装

NASA数据MCP

一个功能丰富的 NASA 数据查询 MCP 工具，支持多种 NASA API 服务和自然语言查询。

4.5

立即安装

金融数据MCP

允许检索股票数据作为 LLMs 的上下文使用。

4.5

立即安装

CoinCap币价MCP

使用 CoinCap API 提供全面加密货币分析

4.5

立即安装

知识记忆MCP

使用本地知识图谱实现持久内存的基本方法。使得大模型能够在多次聊天中记住用户的相关信息。

4.5

立即安装

FramePack

低门槛生成高质量的视频

4.5

立即安装

查航班MCP

查询飞行信息、天气数据和飞行舒适度指标

4.5

立即安装

HowToCook MCP

为你推荐菜谱、规划膳食

4.5

立即安装

12306 MCP

搜索12306的车票

4.8

立即安装

IndexTTS

新一代工业级文本转语音（TTS）模型，语音克隆神器。

4.8

立即安装

Qwen3

Qwen3 是由阿里云 Qwen 团队开发的大型语言模型系列。

4.8

立即安装

ComfyUI+LoRA[色孽]

通过ComfyUI工作流生成色孽风格的图像

4.4

立即安装

ComfyUI+LoRA[薇尔莉特]

通过ComfyUI工作流生成薇尔莉特风格的图像

4.5

立即安装

HiDream-I1

拥有17B参数的新型开源图像生成模型，能够在几秒钟内实现最先进的图像生成质量。

4.5

立即安装

查天气MCP

用于查询中国城市的天气

4.7

立即安装

抓取网页MCP

用于轻松获取和转换网页内容为多种格式（HTML、JSON、Markdown、纯文本）

4.3

立即安装

Geoapify MCP

将地址转换为 GPS 坐标以进行映射，并可选择使用 Geoapify 服务器创建这些坐标的图像。

4.3

立即安装

艺术探索MCP

提供对 Rijksmuseum 收藏品的访问，允许 AI 模型探索、分析和与艺术品及收藏进行互动。

4.2

立即安装

搜图MCP

一个用于 Unsplash 图像搜索的 MCP Server

4.2

立即安装

高德地图MCP

高德地图官方 MCP Server

4.6

立即安装

AI绘图MCP

基于Flux.1-dev为对话模型提供生成图片的能力

4.4

立即安装

联网搜索MCP

搜索引擎，支持搜索与信息提取功能。

4.5

立即安装

SkyReels-V1

SkyReels-V1是中国面向AI短剧创作的视频生成模型。

4.7

立即安装

SkyReels-A1

中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1

4.2

立即安装

万相2.1

阿里巴巴开源的视频生成模型

4.8

立即安装

DeepSeek-R1-Distill

DeepSeek-R1-Distill是DeepSeek-R1的蒸馏小参数模型，在保持性能的同时降低了资源消耗。

4.8

立即安装

AniPortrait

音频驱动的肖像动画合成框架，能够根据音频和静态人脸图片生成逼真的动态视频。

4.3

立即安装

RAGFlow

为各种规模的企业及个人提供一套精简的RAG工作流程，结合大语言模型（LLM）针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。

4.7

立即安装

Flowise

低代码工具，供开发人员构建定制的LLM编排流程和AI Agent。

4.6

立即安装

FastGPT

开源 AI 知识库构建平台。提供了开箱即用的数据处理、模型调用、RAG 检索、可视化 AI 工作流编排等能力，帮助您轻松构建复杂的 AI 应用。

4.5

立即安装

‌‌‌Dify

提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力，轻松构建和运营生成式 AI 原生应用。

4.8

立即安装

Stable Video Diffusion

支持以图像或文本提示作为输入，输出长达4秒的平滑、多帧视频片段。

4.5

立即安装

LivePortrait

将静态照片或图像转换为动态视频。它能够准确、实时地将驱动视频中的表情、姿态迁移到静态或动态人像视频上，生成极具表现力的视频结果‌。

4.3

立即安装

SadTalker

SadTalker能够将一张静态的肖像图片和一段音频融合，通过AI生成一个逼真的说话头像视频，仿佛让一张照片变得“会说话”。

4.2

立即安装

Paints-UNDO

基于AI的绘画过程生成工具，能够自动生成图像的绘画过程视频。

4.6

立即安装

CogVideo

AI 驱动视频生成解决方案，其核心技术依托于前沿的深度学习算法和模型架构。

4.5

立即安装

MockingBird

AI拟声应用，5秒内克隆您的声音并生成任意语音内容。

4.6

立即安装

F5-TTS

支持跨语言语音克隆(比如用英语说话人的声音说中文)、语速控制、零样本语音生成(不需要针对新说话人重新训练)、多种语音类型合成、长文本语音生成等功能。

4.8

立即安装

FishSpeech

文本转语音工具，它通过大量的数据训练，能够生成接近人类水平的语音。

4.3

立即安装

CosyVoice

基于语音量化编码的语音生成大模型，能够深度融合文本理解和语音生成，实现自然流畅的语音生成体验。

4.5

立即安装

RVC

基于VITS技术的革新性语音转换框架，专为追求声音变换极致体验的用户精心打造。

4.6

立即安装

GPT-SoVITS

即使没有直接的训练数据，模型仍能生成相似风格的语音。

4.8

立即安装

ChatTTS_colab

基于 ChatTTS ，支持流式输出、音色抽卡、长音频生成和分角色朗读。

4.1

立即安装

ChatTTS

专为对话场景设计的文本到语音（TTS）模型，特别适用于大型语言模型（LLM）助手的对话任务、对话式音频和视频介绍等应用场景。

4.2

立即安装

oobabooga-webui

适用于大型语言模型的Gradio Web UI。

4.3

立即安装

Ollama Open WebUI

用于在本地运行大型语言模型（LLM）的开源Web界面。本应用已对接Ollama。

4.5

立即安装

Ollama

大语言模型服务工具，用于简化在本地运行大语言模型，降低使用大语言模型的门槛

4.7

立即安装

InstantID

一张照片，无需训练，秒级个人写真生成。

4.6

立即安装

PuLID

PuLID能够在单张参考图像的基础上，快速生成具有高度个性化特征的图像和视频。

4.6

立即安装

FaceFusion

AI换脸软件，适用于图片和视频的换脸操作。它提供了简洁的用户界面，使得操作简单易懂，即使是初学者也能轻松上手。

4.8

立即安装

SD-Trainer

Stable Diffusion进行微调训练的WebUI，上传少量图片，可以方便的训练出新的SD模型，生成期望的图片风格。

4.8

立即安装

Fluxgym

专为FLUX Lora模型训练设计的工具，其最大亮点在于极低的硬件要求和简便的使用方法。

4.8

立即安装

Omost

一句话即可AI绘画，自动生成关键词，通过简单文本描述生成逼真图像。

4.5

立即安装

FaceChain

生成保留身份特征的人像，仅需一张照片和10几秒钟，就可以生成不同风格的个人形象。

4.8

立即安装

PhotoMaker

AI 照片编辑和生成工具。无需训练 LoRA，只需上传几张人物照片，即可生成多种风格且逼真的人物图像。

4.6

立即安装

IOPaint

图像修复工具，只需简单涂抹便可以编辑图片，从而实现图像抹除、对象替换等功能。

4.6

立即安装

Fooocus

支持高质量文本到图像转换，简化操作

4.8

立即安装

Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forge 是一个构建在 Stable Diffusion WebUI 之上的平台

4.8

立即安装

Stable Diffusion WebUI

一种基于深度学习的文本到图像生成模型

4.8

立即安装

ComfyUI

ComfyUI是一款基于节点工作流稳定扩散算法的图形界面。

4.9

立即安装