Posted in

Qwen3:大模型“卷王”出炉,魔法打败魔法

阿里终于登顶大模型“铁王座”。其最新发布的Qwen3只靠235B参数就横扫各大基准,不仅性能全面超越OpenAI o1和DeepSeek-R1,部署成本也只需要性能相近模型的三分之一,堪称大模型界的新任“卷王”。

Qwen3现已上线appmall.ai,价格低至2.3元/小时。今天AppMall就带大家来一起测试下,Qwen3到底有什么神奇魔法,能让年初刚刚火爆全球的DeepSeek都黯然失色。

Qwen3:出道即碾压

Qwen3不仅成本同比更低、性能更高,还实现了碾压国内外主流AI大模型的功能配置,包括:

  • 混合思考:DeepSeek的最大优势就是深度思考模式,但是面对简单问题也要来一遍深度思考,就非常浪费时间了。而Qwen3的厉害之处是,能自动识别用户需求,在思考模式、非思考模式之间自动无缝切换,确保各种场景达到最佳效能。
  • 语言专家:支持119种语言和方言,能达到多语言指令跟随、实时翻译。AppMall此前实测多款大模型,在小语种识别准确度方面,Qwen3可谓一骑绝尘。
  • 拟人对话:更符合人类偏好,擅长创意写作、多轮对话、角色扮演,同时在数学、代码生成和常识逻辑推理方面的能力显著增强,更能胜任复杂问题。
  • 强大集成:全面支持AI Agent等外部工具的精确集成,并且在复杂任务中表现出了领先的性能。也就是说Qwen3不仅是普通玩家的日常好帮手,还能全然胜任AI深度使用者“生产力工具”的角色。

Qwen3如何使用?

无需费心费力部署,Qwen3现已上线appmall.ai,只需低至2.3元/小时的价格(按分钟计费,后台删除应用即停止扣费),即可在线一键使用。

点击【安装并启动】后,进入应用。初次访问需要先设置Open WebUI的用户名和密码,这里简单输入即可,接着点击【创建管理员账号】,就可以进到Qwen3的用户界面了。

跟所有Chatbot类大模型一样,Qwen3也是一个清爽对话框。下面我们来它在普通用户日常高频应用场景中的表现吧。

(1)混合思考

值得注意的是,如果用户是首次使用,第一场对话需要加载模型,相对需要1-2分钟时长。之后再对话就基本可以实现秒回了。

首先看简单需求,要求AI识别某句原文来自哪个名人的哪部作品。Qwen3应该是自动切换到了“简单粗暴”模式,几秒钟就给出了准确回答,并且自行增加了原文、背景含义和补充说明。

接下来我们稍微升级一点需求,要求AI提供《前出师表》的原文。考核事项是:回答是否准确、完整,同时前后出师表是否混淆。

可以看到,Qwen3的思考过程更复杂,包括:确认需求-检查信息准确性-是否补充背景-检查格式-是否有其他混淆内容。最终给出的全文也是准确的。

(2)语言专家

Qwen3支持119种语言,在跨语言对话、翻译等场景简直堪称神器,而且国内用户使用起来,还不用再发愁遇到DeepL这种国外生产力工具访问慢的痛点。

但美中不足的是,Qwen3的开源版本并不支持图片识别,因此无法做到图片翻译这种功能,只能基于文本进行交互。下面就对多语言常用场景进行实测。

首先是翻译场景。贴一段法语菜单(未注明语种),要求AI翻译,很快自动识别并给出了中文译文,且按照菜单格式进行排列呈现,过关。

接下来直接看语言交互。假设我们是德语用户,需要写一份企业参加汉诺威工博会的注意事项,要求AI帮忙简单撰写。我们直接使用德语“Ich muss eine Liste mit Hinweisen für Unternehmen, die an der Hannover Messe teilnehmen, verfassen. Könnten Sie mir dabei kurz helfen?”发送需求。

可以看到下图,Qwen3切换为了思考模式,思考过程使用的是英语,但是答案使用的是德语。

将其和目前中国C端用户使用比较多的豆包、DeepSeek做一个简单对比。可以看到豆包面对德语问题,虽然能够理解,但是回答仍然使用中文,只有答案文档里使用了德语;而DeepSeek的思考过程、回答都是德语,但是速度比Qwen3要慢上不少。综合体感下,Qwen3胜出。

(3)拟人对话

创意写作作为Chatbot的看家本领,Qwen3的表现基本符合预期。当要求AI“请使用王家卫的语言风格,围绕东方超算最新推出的AI应用商店(已上线40+款全球AI潮流应用),撰写一段文字”时,Qwen3给出的回复还比较有趣。

角色扮演和推理方面,我们尝试丢给AI一个现实生活中的复杂难题,看它如何提出应对措施。

  • 背景:你是某景区运营负责人,景区即将举办年度文化节(投入500万,主管部门重点支持项目),但活动前 3 天出现以下问题:
  • 合作方甲(搭建商):因你方拖欠工程款(财务部门未及时拨款),擅自停工,称“不结清尾款就拆设备”,而财务总监告知“最多先付30%”;
  • 合作方乙(当地民俗表演队):队长是景区所在村的村长,突然要求增加20%演出费,否则带领村民堵门,理由是“去年你们承诺的村民就业名额没兑现”;
  • 文旅局:领导明天要带队视察筹备情况,如果出岔子,文化节可能被紧急叫停。
  • 你必须确保文化节如期举行。请回答如何在 24 小时内说服甲复工、乙放弃加价?向文旅局领导汇报时,你会主动提及当前的问题吗?如果提及,如何说明解决方案以争取信任?

整体来看, Qwen3给出的回答中,虽然部分事项的真实可行性不高,但瑕不掩瑜,它给出的既包括整体策略、行动步骤、关键话术,还提供了关于风险预案、备用方案、后续优化等方面的建议,可以说完整且合理。

同时,Qwen3还在总结中明确提出“最终目标是将危机转化为主管部门信任增强+团队凝聚力增强的机会”,让人惊呼Qwen3比社畜更懂汇报和向上管理,拟人化程度显著提升。

怎么样,Qwen3实测体验是不是还挺有趣的?快来appmall.ai试用Qwen3这款大模型“卷王”吧,还可以自行探索打造AI Agent生产力工具,让AI为自己的工作生活注入更多奇妙魔法~