AI与自动化

Qwen3.6-35B-A3B 越狱版来了！目前最强“无审查”开源模型？6G 显存都能跑，本地 AI 彻底自由了

作者大神K

2026年5月25日 3 分钟阅读

最近 AI 圈，真的越来越离谱了。如果你一直关注本地大模型，应该已经发现：现在的开源模型，不仅越来越聪明，甚至已经开始挑战很多闭源商业 AI。而今天要介绍的这个模型，更是直接把“本地 AI”推向了另一个阶段。

它就是： Qwen3.6-35B-A3B Uncensored HauhauCS Aggressive

一个目前热度极高的“越狱版”开源模型。而且重点是：它不仅无审查、无限制，还非常聪明。甚至可以说：这可能是目前最强的越狱版开源模型之一。

什么是“越狱版”模型？

简单来说：

官方模型通常会加入大量安全限制。

比如：

敏感内容拒答
某些问题无法回答
强制政治正确
输出被过滤
系统提示词限制

所以很多时候：

你明明只是正常提问。

结果模型却：

“抱歉，我无法帮助你。”

而这类 Uncensored（无审查）版本：

则会尽可能移除这些限制。

尤其这个：

Aggressive 版本

可以说是：

目前最激进的版本之一。

官方模型 VS 越狱版模型

实测效果非常夸张。同样的问题：

官方模型：

而越狱版：

不仅会回答。

甚至：

什么都敢说
什么都肯干
几乎没有限制

而且最关键的是：

它并不是那种：

“只会越狱，但智商很低”的模型。

恰恰相反。

这个模型：

真的非常聪明。

部署教程：

1、模型下载

链接：https://pan.quark.cn/s/0de8c5110d38
提取码：JRfa

模型来源： O站社区

里面有多种不同大小的量化版，你可以根据自己的显存大小，来选择对应的版本，最小的11G模型可以在6G/8G显存上跑起来，但是建议最低使用8G显存

2、下载 llama.cpp

下载方式 ：【 Github下载 】、【 网盘下载 】或【 整合包下载 】

这款免费开源项目支持 N卡、A卡、I卡还有纯CPU运行，同时也可以在Mac、Linux系统上运行！也就意味着，你几乎可以在任何电脑上进行运行。速度还非常快，远比ollama、LM Studio 快的多也稳定的多！！

3、一键启动脚本（支持多版本切换）

将下面的的脚本另存为BAT批处理，保存的时候选择utf-8格式

@echo off
chcp 65001 >nul
title Qwen3.6-35B-A3B 越狱版

cd /d "%~dp0"

:menu
cls
echo ==========================================
echo      Qwen3.6-35B-A3B 越狱版+多模态模型
echo               零度优化版
echo ==========================================
echo.
echo 1. Q4_K_P（4090 推荐）
echo 2. Q4_K_M（稳定版）
echo 3. IQ4_NL（高压缩高质量）
echo 4. IQ2_M（6G/8G 显卡）
echo.
echo ==========================================

set /p choice=请输入数字：

if "%choice%"=="1" (
    llama-server.exe ^
    -m "models\Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf" ^
    --mmproj "models\mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf" ^
    -ngl 999 ^
    -c 131072 ^
    -n 8192 ^
    --host 127.0.0.1 ^
    --port 8080
)

if "%choice%"=="2" (
    llama-server.exe ^
    -m "models\Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf" ^
    --mmproj "models\mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf" ^
    -ngl 999 ^
    -c 131072 ^
    -n 8192 ^
    --host 127.0.0.1 ^
    --port 8080
)

if "%choice%"=="3" (
    llama-server.exe ^
    -m "models\Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ4_NL.gguf" ^
    --mmproj "models\mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf" ^
    -ngl 999 ^
    -c 131072 ^
    -n 8192 ^
    --host 127.0.0.1 ^
    --port 8080
)

if "%choice%"=="4" (
    llama-server.exe ^
    -m "models\Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ2_M.gguf" ^
    --mmproj "models\mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf" ^
    -ngl 999 ^
    -c 8192 ^
    -n 4096 ^
    --host 127.0.0.1 ^
    --port 8080
)

pause

打开后在上面选择对应的模型，输入对应的数字确认即可启动！

当然需要真正实现tokens自由，本地不受限制，完全免费使用AI Agent，那么将其对接到Hermes或者OpenClaw 小龙虾上去，才能真正体现出它的价值所在。

AI Agent 对接步骤：

1、在选择模型提供商的时候，选择自定义

2、API base 地址填写：

http://127.0.0.1:8080/v1

API key 密钥随便填写一个数字或留空都可以

3、其它设置可以根据自己的喜好进行自定义

Qw

6G 显存都能跑？

是的。

这也是它最夸张的地方之一。

通过 GGUF 量化后：

甚至：

6G 显存
8G 显存
普通游戏显卡

都能运行。

并且支持：

NVIDIA 显卡
AMD 显卡
Intel Arc 显卡

真正实现：

本地 AI 自由

在 Artificial Analysis 排行榜中表现极强

目前在全球权威 AI 榜单：

Artificial Analysis

Qwen3.6-35B-A3B 在 40B 以内开源模型中：

几乎属于第一梯队。

尤其：

中文理解
代码能力
多模态视觉
推理能力
长上下文能力

表现都非常夸张。

尤其中文能力。

可以说：

这是目前中文体验最强的一批开源模型。

多模态支持也非常离谱

这次不仅支持文本。

还支持：

多模态视觉识图

也就是说：

它可以直接：

看图片
分析截图
OCR 识别
理解画面内容
分析复杂 UI
阅读代码截图

配合 llama.cpp 最新版后：

甚至已经可以当：

本地版 ChatGPT Vision

来使用。

本地部署非常简单

这次部署方案：

我使用的是：

llama.cpp 最新版

优点非常明显：

免费
开源
支持 Windows
支持 CUDA
支持 Vulkan
支持 AMD
支持 Intel

而且：

现在 llama.cpp 已经越来越成熟。

不仅支持：

OpenAI API
多模态
超长上下文
Agent 调用

甚至还能直接：

本地替代 OpenAI API

Hermes Agent 实测效果惊艳

这次我还把它：

接入了 Hermes Agent。

效果可以说：

非常炸裂。

因为现在：

你不仅仅是在“聊天”。

而是：

真正拥有了一个：

本地 AI Agent

它可以：

自动写代码
自动分析图片
自动执行任务
自动工具调用
自动联网
长上下文记忆

而且：

完全本地运行。

不用联网。

不用 API Key。

没有 Token 消耗。

真正实现：

Token 自由
Agent 自由
本地 AI 自由

RTX 4090 / 24G 显存

8G 显存用户

–mmproj

是多模态必须参数。

否则：

上传图片按钮会变灰。

–jinja

则是新版 Qwen 模型非常重要的参数。

不加的话：

可能出现：

回复异常
格式错乱
无限重复
中文异常

现在的本地 AI，已经完全变了

很多人对本地模型的印象：

还停留在：

很笨
很慢
只能聊天
无法实用
但现在。

真的不一样了。

尤其：

Qwen3.6-35B-A3B 这种模型出现后。

本地 AI 已经开始：

真正接近商业闭源模型。

而且：

完全属于你自己。

最后

如果你一直想体验：

无审查 AI
本地 AI
多模态 AI
本地 Agent
超长上下文
本地 OpenAI API
那么：

这个模型。真的非常值得尝试。因为现在这种资源：谁也不知道还能存在多久。建议尽快收藏、下载、备份！

文章作者：大神K

原文链接：https://dashenk.com/2026/05/25/qwen3-6-35b-a3b-%e8%b6%8a%e7%8b%b1%e7%89%88%e6%9d%a5%e4%ba%86%ef%bc%81%e7%9b%ae%e5%89%8d%e6%9c%80%e5%bc%ba%e6%97%a0%e5%ae%a1%e6%9f%a5%e5%bc%80%e6%ba%90%e6%a8%a1%e5%9e%8b%ef%bc%9f6g/

版权说明：本文为原创内容，转载请注明出处。

Qwen3.6-35B-A3B 越狱版来了！目前最强“无审查”开源模型？6G 显存都能跑，本地 AI 彻底自由了

什么是“越狱版”模型？

Aggressive 版本

官方模型 VS 越狱版模型

部署教程：

1、模型下载

2、下载 llama.cpp

这款免费开源项目支持 N卡、A卡、I卡还有纯CPU运行，同时也可以在Mac、Linux系统上运行！也就意味着，你几乎可以在任何电脑上进行运行。速度还非常快，远比ollama、LM Studio 快的多也稳定的多！！

3、一键启动脚本（支持多版本切换）

打开后在上面选择对应的模型，输入对应的数字确认即可启动！

AI Agent 对接步骤：

Qw

6G 显存都能跑？

本地 AI 自由

在 Artificial Analysis 排行榜中表现极强

Artificial Analysis

多模态支持也非常离谱

多模态视觉识图

本地版 ChatGPT Vision

本地部署非常简单

llama.cpp 最新版

本地替代 OpenAI API

Hermes Agent 实测效果惊艳

本地 AI Agent

推荐量化版本

RTX 4090 / 24G 显存

8G 显存用户

推荐 llama.cpp 参数

–mmproj

–jinja

现在的本地 AI，已经完全变了

最后

标签：

大神K

其他文章

DediOne：特别优惠中国优化套餐$12.99年付，100m无线流量不容错过！

18+ 🔞成人分享，仅供参考！

暂无评论！成为第一个。

发表回复取消回复

Qwen3.6-35B-A3B 越狱版来了！目前最强“无审查”开源模型？6G 显存都能跑，本地 AI 彻底自由了

什么是“越狱版”模型？

Aggressive 版本

官方模型 VS 越狱版模型

部署教程：

1、模型下载

2、下载 llama.cpp

这款免费开源项目支持 N卡、A卡、I卡 还有纯CPU运行，同时也可以在Mac、Linux系统上运行！也就意味着，你几乎可以在任何电脑上进行运行。速度还非常快，远比ollama、LM Studio 快的多也稳定的多！！

3、一键启动脚本（支持多版本切换）

打开后在上面选择对应的模型，输入对应的数字确认即可启动！

AI Agent 对接步骤：

Qw

6G 显存都能跑？

本地 AI 自由

在 Artificial Analysis 排行榜中表现极强

Artificial Analysis

多模态支持也非常离谱

多模态视觉识图

本地版 ChatGPT Vision

本地部署非常简单

llama.cpp 最新版

本地替代 OpenAI API

Hermes Agent 实测效果惊艳

本地 AI Agent

推荐量化版本

RTX 4090 / 24G 显存

8G 显存用户

推荐 llama.cpp 参数

–mmproj

–jinja

现在的本地 AI，已经完全变了

最后

标签：

大神K

其他文章

DediOne：特别优惠中国优化套餐$12.99年付，100m无线流量不容错过！

18+ 🔞成人分享，仅供参考！

暂无评论！成为第一个。

发表回复 取消回复

这款免费开源项目支持 N卡、A卡、I卡还有纯CPU运行，同时也可以在Mac、Linux系统上运行！也就意味着，你几乎可以在任何电脑上进行运行。速度还非常快，远比ollama、LM Studio 快的多也稳定的多！！

发表回复取消回复