你的电脑还能跑得动AI吗？这个网站一测，结果太扎心了

想在自己的电脑上跑大模型？

这想法很美好，现实却往往很骨感。最近有个网站火了，名字简单粗暴——"Can I run AI locally?"（我能在本地运行AI吗？）。

它不跟你讲大道理，直接拿你的浏览器配置算一笔账，然后告诉你一个残酷的真相：你想跑的那个模型，可能连门都进不来。

512GB内存才够跑？顶级大模型是硬件粉碎机

说实话，看完这个榜单，我的血压升高了。

来看看这些"庞然大物"：Kimi K2，参数量1T（万亿），需要512.2GB内存。注意，是512GB！这还不是硬盘，是内存。

再看DeepSeek V3.2，685B参数，内存需求350.9GB。哪怕是稍微"亲民"一点的Llama 3.3 70B，也得吃掉35.9GB内存。

AI配图

网站给出的评价非常统一且冷酷：Too heavy（太重了）。

评分全是F，0分。

这意味着什么？意味着市面上99%的个人电脑，在这些模型面前，连入场券都拿不到。你以为自己那台配了32GB内存的MacBook Pro已经很顶了？在这些大家伙面前，它就是个玩具。

更有意思的是，网站还给了一个"内存占用率"指标。Kimi K2的内存占用率显示为6403%。

这数字看着是不是有点魔幻？说白了就是，你把电脑砸了凑零件，也凑不出这么多内存。

小模型的逆袭：0.5GB也能玩出花样

别急着绝望。

把页面往下滑，你会发现另一个世界。那里有一群"小个子"，活得滋润得很。

比如Qwen 3.5 0.8B，只要0.5GB内存。评分？S级，89分。运行速度能达到每秒70个token。

这是什么概念？你眨一下眼，它已经写完一句话了。

类似的还有Llama 3.2 1B、Gemma 3 1B，都是0.5GB的内存需求，评分全是S级。TinyLlama 1.1B稍微大点，0.6GB，评分也有86分。

这些模型被标注为"Runs great"（运行极佳）。

这就很有意思了。一边是512GB内存都不够的巨无霸，一边是0.5GB就能起飞的小精灵。AI世界的贫富差距，比我们想象的要大得多。

中产陷阱：跑是能跑，就是有点卡

当然，大部分人既不想跑个"玩具模型"，也跑不动"巨无霸"。

我们更关心的，是那些处于中间地带的模型。比如Llama 3.1 8B，Meta出品，质量速度平衡得不错，名气也大。

但网站给出的评价是：Barely runs（勉强运行）。

评分只有D，33分。

内存需求4.1GB，看着不高，但运行速度掉到了每秒9个token。这速度，基本上就是你问一句，它想半天，然后慢吞吞吐几个字。

再看Qwen 3 8B、Gemma 2 9B，情况都差不多。评分D，速度个位数。

AI配图

这就是"中产陷阱"。

你想追求一点智能，不想用太小的模型，结果发现你的硬件配置，其实挺尴尬的。跑是能跑，就是体验感极差。

评论区比正文精彩：100小时的配置噩梦

这个网站引发了热烈讨论，评论区的吐槽简直是一部血泪史。

一位用户坦言：

"过去两年我花了大量时间在本地模型上实验。得出的教训是：小模型比如新的Qwen3.5:9b在本地工具使用和信息提取上表现出色。但对于编程工具？老实讲，直接用Google的Gemini或者Anthropic Claude吧。"

最扎心的是这句：

"去年我大概花了100个小时配置本地编程模型。"

100个小时啊！这时间都够你把一门新语言学到入门了。结果最后发现，还是云端API香。

这就是本地部署的隐形成本。你以为省了API费，其实搭进去的是命。

MoE模型的"欺骗性"与硬件识别的bug

还有技术宅指出了网站的计算逻辑漏洞。

AI配图

对于Dense模型（稠密模型），按内存带宽和模型大小估算没问题。但对于MoE模型（混合专家模型），这算法就不准了。

比如GPT-OSS 20B，虽然总参数20B，但每次推理只激活3.6B参数。这意味着它的实际运行表现，应该接近一个3-4B的稠密模型，而不是那个臃肿的20B。

它需要的显存确实大，但跑起来其实挺快。

网站在这方面似乎没有完全区分开。

另外，硬件识别也被人吐槽。有人指出：

"网站列出了不存在的'M4 Ultra'，却漏掉了RTX Pro 6000这种新卡。"

"M3 Ultra最高支持512GB内存，但网站选项只到192GB。"

看来，这个工具本身也还在进化中。

本地AI的梦，醒了还是继续做？

看完这一圈数据，你会发现一个事实：AI公司的估值在涨，模型的参数在涨，唯独你电脑的内存，还是那个死样。

模型确实有极限，但这个极限对于个人用户来说，依然高不可攀。

那些动辄几百GB的模型，注定是数据中心里的宠物，不是你桌面上的玩物。

好消息是，小模型正在变得越来越强。Qwen 3.5 0.8B这种"小不点"，在特定任务上已经能打。

坏消息是，如果你想体验最顶尖的智能，本地部署这条路，目前还是死胡同。

所以，你是打算花100小时去折腾环境，还是老老实实掏钱买API？

这可能是每个想玩本地AI的人，都要面对的灵魂拷问。

【glm-5锐评】：本地跑大模型就像用自行车拉集装箱，精神可嘉，但不如直接叫货拉拉。

参考链接：
https://www.canirun.ai/