新手该接 API 还是本地模型？

新手几乎都该先接云端 API。它不挑机器、配置只要填一个 key，模型能力也更强，工具调用更稳，能让你先把龙虾整套流程跑顺。等你确定要长期重度用、又在意隐私和成本，再考虑上本地模型。先 API 后本地，少走弯路。

本地模型真的免费吗？

模型权重免费、推理不向谁付费，这点是真的。但前期要买得起一块够用的显卡，跑起来还吃电。所以它是「前期硬件投入换长期零边际成本」——你用得越多越划算，偶尔用反而是 API 更省。算账要把显卡折旧和电费也算进去。

两条路能同时配、随时切换吗？

可以。很多人就是「平时跑本地模型省钱，遇到难任务临时切 API 上强模型」。做法是在配置里把两套都写好，靠一个开关变量切换；或者用支持多 provider 的网关统一管理。龙虾本体不在乎大脑是谁，换地址就行。

教程 · 配置

给龙虾接大脑：云端 API 还是本地模型？配置与取舍

钳叔 · 龙虾AI 编辑部 · 2026-06-07 · 约 9 分钟

龙虾本体只是个会调工具、能循环执行的外壳，它没智商——智商来自你给它接的那个大模型。这步是新手最关键也最容易选错的一步：接云端 API，还是本地跑模型？两条路差得很远。这篇把两套配置都写清楚，再用一张表把成本、隐私、速度摆在一起，让你照着选。

两条路，本质区别在“算在哪”

云端 API：你把任务发给服务商（Claude、GPT、Gemini 等），模型在人家的服务器上算，结果传回来。本机不需要显卡，按用量花钱。
本地模型：用一个本地推理工具把开源模型（DeepSeek、Qwen 等）跑在你自己的机器上，数据不出本机，不向谁付费，但吃你的显卡。

龙虾不在乎大脑是谁，它只要一个“能对话、能调工具”的接口。所以两条路对它来说，差别就落在配置文件那几行地址上。

路 A：接云端 API（新手首选）

去模型服务商后台拿一个 API key，填进 .env。字段名以项目文档为准，大致这样：

MODEL_PROVIDER=anthropic
MODEL_NAME=claude-...
API_KEY=sk-你的密钥
# 有的项目还要填接口地址
# API_BASE=https://api.服务商.com/v1

填完就能跑，不用装别的。优点是省事、模型强、工具调用稳；缺点是按 token 计费、数据要发到对方服务器。哪个模型当大脑更顺手，我们在 AI 模型榜按工具调用稳定性、长任务连贯性、中文表现和成本打了分；如果你打算接 2026-07 新发布的 GPT-5.6，三档怎么选、成本怎么心算，看跑龙虾该用哪档 GPT-5.6。

路 B：接本地模型

先用一个本地推理工具把开源模型拉起来，跑成一个本地服务（监听某个端口），再让龙虾指向那个地址：

# 1. 用推理工具把模型拉起来（示意）
#    它会在本机起一个服务，比如监听 11434 端口

# 2. 在 .env 里让龙虾指过去
MODEL_PROVIDER=local
MODEL_NAME=你拉起来的模型名
API_BASE=http://localhost:11434

关键点：本地模型的“聪明程度”和“速度”都由你的显卡决定。显存小只能跑小模型，复杂的多步任务容易掉链子；显存大才能上更强的模型。具体要什么配置，看我们的硬件配置对照。

三个维度摆一起：怎么选一目了然

对比项	云端 API	本地模型
前期投入	几乎为零，注册拿 key 即用	要先买够用的显卡，门槛高
长期成本	按用量持续付费，用得多越贵	电费为主，用得越多越划算
隐私	数据发到服务商，敏感数据要谨慎	数据不出本机，最私密
模型能力	顶级强模型，工具调用最稳	受显卡限制，复杂任务上限低
速度	取决于网络，通常稳定	取决于显卡，强卡很快、弱卡慢
联网依赖	必须联网	断网也能用
上手难度	低，填一个 key	高，要会拉模型、调显存

一句话总结：偶尔用、求省事、要强模型 → 走 API；重度用、在意隐私、有显卡 → 上本地。拿不准就先 API，跑顺了再说。

实际体会 同样一条“读 CSV、按某列排序、写回新文件”的小任务，两条路的体感差得很明显。走云端 API：响应快、结果稳，单次成本也就几分钱，日常用基本无感。换没有独显、靠 CPU 推理的本地小模型（7B 这一档）：明显慢一截，而且任务稍复杂时偶尔会选错列、出点小差错。所以一句话——没像样显卡的机器跑本地模型“能用但慢且偶尔翻车”，日常还是 API 顺手；想真正发挥本地模型，得配带像样显卡的机器。

进阶：两条路一起配，按需切换

不少老手的玩法是“平时本地省钱，难任务临时切 API 上强模型”。做法是两套配置都写好，用一个开关变量切，或者用支持多 provider 的网关统一管。龙虾换大脑只是换地址，随时切。

常见问题

新手该接 API 还是本地模型？: 几乎都该先接云端 API。它不挑机器、只填一个 key，模型更强、工具调用更稳，能让你先把整套流程跑顺。确定要长期重度用又在意隐私成本，再上本地。先 API 后本地。
本地模型真的免费吗？: 模型权重免费、推理不向谁付费是真的，但前期要买够用的显卡、跑起来吃电。它是“前期硬件投入换长期零边际成本”，用得越多越划算，偶尔用反而 API 更省。
两条路能同时配、随时切换吗？: 可以。常见玩法是平时本地省钱、难任务临时切 API。把两套都写进配置用开关切，或用多 provider 网关统一管。龙虾不在乎大脑是谁，换地址就行。