教程 · 配置
给龙虾接大脑:云端 API 还是本地模型?配置与取舍
龙虾本体只是个会调工具、能循环执行的外壳,它没智商——智商来自你给它接的那个大模型。这步是新手最关键也最容易选错的一步:接云端 API,还是本地跑模型?两条路差得很远。这篇把两套配置都写清楚,再用一张表把成本、隐私、速度摆在一起,让你照着选。
两条路,本质区别在“算在哪”
- 云端 API:你把任务发给服务商(Claude、GPT、Gemini 等),模型在人家的服务器上算,结果传回来。本机不需要显卡,按用量花钱。
- 本地模型:用一个本地推理工具把开源模型(DeepSeek、Qwen 等)跑在你自己的机器上,数据不出本机,不向谁付费,但吃你的显卡。
龙虾不在乎大脑是谁,它只要一个“能对话、能调工具”的接口。所以两条路对它来说,差别就落在配置文件那几行地址上。
路 A:接云端 API(新手首选)
去模型服务商后台拿一个 API key,填进 .env。字段名以项目文档为准,大致这样:
MODEL_PROVIDER=anthropic
MODEL_NAME=claude-...
API_KEY=sk-你的密钥
# 有的项目还要填接口地址
# API_BASE=https://api.服务商.com/v1
填完就能跑,不用装别的。优点是省事、模型强、工具调用稳;缺点是按 token 计费、数据要发到对方服务器。哪个模型当大脑更顺手,我们在 AI 模型榜 按工具调用稳定性、长任务连贯性、中文表现和成本打了分。
路 B:接本地模型
先用一个本地推理工具把开源模型拉起来,跑成一个本地服务(监听某个端口),再让龙虾指向那个地址:
# 1. 用推理工具把模型拉起来(示意)
# 它会在本机起一个服务,比如监听 11434 端口
# 2. 在 .env 里让龙虾指过去
MODEL_PROVIDER=local
MODEL_NAME=你拉起来的模型名
API_BASE=http://localhost:11434
关键点:本地模型的“聪明程度”和“速度”都由你的显卡决定。显存小只能跑小模型,复杂的多步任务容易掉链子;显存大才能上更强的模型。具体要什么配置,看我们的 硬件配置对照。
三个维度摆一起:怎么选一目了然
| 对比项 | 云端 API | 本地模型 |
|---|---|---|
| 前期投入 | 几乎为零,注册拿 key 即用 | 要先买够用的显卡,门槛高 |
| 长期成本 | 按用量持续付费,用得多越贵 | 电费为主,用得越多越划算 |
| 隐私 | 数据发到服务商,敏感数据要谨慎 | 数据不出本机,最私密 |
| 模型能力 | 顶级强模型,工具调用最稳 | 受显卡限制,复杂任务上限低 |
| 速度 | 取决于网络,通常稳定 | 取决于显卡,强卡很快、弱卡慢 |
| 联网依赖 | 必须联网 | 断网也能用 |
| 上手难度 | 低,填一个 key | 高,要会拉模型、调显存 |
一句话总结:偶尔用、求省事、要强模型 → 走 API;重度用、在意隐私、有显卡 → 上本地。拿不准就先 API,跑顺了再说。
🦞 实际体会
同样一条“读 CSV、按某列排序、写回新文件”的小任务,两条路的体感差得很明显。走云端 API:响应快、结果稳,单次成本也就几分钱,日常用基本无感。换没有独显、靠 CPU 推理的本地小模型(7B 这一档):明显慢一截,而且任务稍复杂时偶尔会选错列、出点小差错。所以一句话——没像样显卡的机器跑本地模型“能用但慢且偶尔翻车”,日常还是 API 顺手;想真正发挥本地模型,得配带像样显卡的机器。
进阶:两条路一起配,按需切换
不少老手的玩法是“平时本地省钱,难任务临时切 API 上强模型”。做法是两套配置都写好,用一个开关变量切,或者用支持多 provider 的网关统一管。龙虾换大脑只是换地址,随时切。
常见问题
- 新手该接 API 还是本地模型?
- 几乎都该先接云端 API。它不挑机器、只填一个 key,模型更强、工具调用更稳,能让你先把整套流程跑顺。确定要长期重度用又在意隐私成本,再上本地。先 API 后本地。
- 本地模型真的免费吗?
- 模型权重免费、推理不向谁付费是真的,但前期要买够用的显卡、跑起来吃电。它是“前期硬件投入换长期零边际成本”,用得越多越划算,偶尔用反而 API 更省。
- 两条路能同时配、随时切换吗?
- 可以。常见玩法是平时本地省钱、难任务临时切 API。把两套都写进配置用开关切,或用多 provider 网关统一管。龙虾不在乎大脑是谁,换地址就行。