飞社-令人惊奇的创意工作者社区-程序员想自己本地跑大模型，学习大模型，做一些微调等操作，目前看到一款小主机在预算内， CPU AMD Ryzen Al Max+ 395，不知道这套配置是否适合用来学习大模型跑大模型，有没有懂的兄弟可以给点建议。

hmbb

@shuimugan 好像自己组 NVIDIA 显卡主机比较适合学习用

hmbb

@402124773 主要买成品比较省事

lithiumii

amd 这一代虽然能跑了，但还是太慢，最后你还是得走上魔改老黄的邪路。或者再等等看下一代

hmbb

@lithiumii 貌似是的，下一代可能会好些

nightwitch

现在国内租用 gpu 的平台多的是...4090 这种也就两三块钱一小时，3080 这种更便宜。入门绰绰有余了，500 块钱能够你从入门到放弃好几回了

shuimugan

你先明确学习的内容是什么。首先排除训练，Llama 3.1 8B 训练使用 1024 张 H100 80G 训练了一个月也就那样；然后就微调，显存小就跑个 gpt-oss-20b 和 Qwen3-30B-A3B 的规模，https://docs.unsloth.ai/basics/gpt-oss-how-to-run-and-fine-tune https://docs.unsloth.ai/basics/qwen3-how-to-run-and-fine-tune 大点的模型还不如去 https://www.together.ai/ 导入你的数据集点几下按钮就开始微调了。然后是推理，推理吃的是带宽和显存，这个价格你直接在 https://apxml.com/zh/tools/vram-calculator 选你要跑的模型和设备来看模拟推理的速度心里就有数了，这个配置性价比最高的也就是跑 gpt-oss-120b 的 mxfp4 量化，其次是 GLM 4.5 Air 的 4bit 量化，速度也就那样，选择 M4 Max 看速度然后除以二就懂了。再然后是 RAG ，说白了就是找出相关内容然后字符串拼接，你本地跑和调用 API 也没区别，看 llamaindex 代码就懂了，知识库都是围绕那三五十行代码做各种业务和 UI 的封装。 https://github.com/run-llama/llama_index/blob/81d4b871143ddd4a7cb90333a3d103fbb1f269c5/llama-index-core/llama_index/core/prompts/chat_prompts.py#L21 剩下的就是画色图、写黄文、声音转文本、文本转声音、声线克隆 @hmbb

@hmbb 自己组也很简单。并且现在电商很发达的，你什么配置的，找抖音本地大主播配一下，也很简单的。我建议你别太相信小主机的散热了，另外现在主流大模型学习还是 nvidia 的显卡吧，amd 那玩意不太靠谱。

charlenehe43

小主机怎么可能跑大模型啊,我 m1 跑个 1.5b 的模型都卡的批爆,而且你这是 amd 的显卡?cuda 用不了吧,当然我是外行哈说错别怪

ryc111

这个小主机很顶，跑小几十 B 的模型都没问题，速度也还过得去（ xB 大小的模型还挺快）大点的模型比如 70B 量化的那种，就比较慢了。自己本地折腾大模型以及建立个人知识库学习学习挺不错的。最好玩的就是折腾一些文生图，图生图，还蛮有意思的，lora 微调啥的，内存都够用。

SGL

最优的选择是现在 GPU 算力平台花个小几百玩玩儿，然后就做大的决策。

浏览过的版块