结构更改、阻止应对、PM 工时全部计算的 3年 TCO 比较
阅读时间: 7分钟 | 2026年1月
核心摘要
外包爬虫项目估价单上只写了"开发费用"。但是爬虫制作后开始花钱。如果考虑到网站结构更改、IP 阻止、内部管理人力等因素,3年内额外支出将是初始估价的 2~3倍。
| 项目外包 | 信用(小规模) | 订阅制(大规模) | |
|---|---|---|---|
| 月费用 | 不规则(数百万韩元~) | 3万~28万韩元 | 300万~1,200万韩元 |
| 初始开发费用 | 1,000万~5,000万韩元 | 0韩元 | 0韩元 |
| 维护费用 | 单独合同 | 包括 | 包括 |
| 适合情况 | 真的一次性 | 小规模·不定期采集 | 大规模·常规采集 |
如果是小规模,从 月3万韩元开始,如果是大规模,则选择 订阅制。无论哪种方式,总成本都低于外包。
外包的陷阱:估价单只是第一步的费用
将爬虫外包出去,通常会得到这样的估价单:
"爬虫开发:2,000万韩元。交货期:4周。"
看起来很整洁。预算设定得好,审批也方便,心情也舒畅。
但是爬虫真正开始的是交货之后。
第二步:网站发生变化
爬虫交货后3个月。目标网站更改了 HTML 结构。
联系外包公司。得到的回答是:
"超出原有合同范围,需要额外开发。500万韩元,需要2周时间。"
这并非例外。主要电子商务网站每年更改前端数十次。新闻网站、房地产平台也是如此。
制作爬虫比 维护爬虫更困难。
第三步:被阻止
有一天数据不再进来。IP 被阻止了。
再次联系外包公司。这次联系不上。因为他们正在进行其他项目。
3天后回复:"需要绕过阻止。300万韩元,1周时间。"
这3天内,竞争对手的价格数据是空白的。每天都要告诉销售团队"本周数据没有"。
这种情况反复发生的结构性原因
不应该责怪外包公司。商业模式就是这样运作的:
- 外包公司大部分收入来自于 新项目
- 维护 不具备盈利能力
- 与应对现有客户的紧急请求相比,新客户项目更优先
相比之下,订阅制则完全相反。维持现有客户本身就是收入来源,因此有快速响应的激励。商业模式站在客户一边。
3年 TCO 比较:运行3个爬虫的情景
这是实际企业中常见的配置:
- 运行3个爬虫(竞争对手价格、新闻、招聘数据)
- 每个网站每年进行4次结构更改(保守估计)
- 每年发生2次阻止
项目外包
| 项目 | 计算依据 | 3年总计 |
|---|---|---|
| 初始开发 | 每个爬虫 2,000万韩元 × 3个 | 6,000万韩元 |
| 结构更改应对 | 每次 300万韩元 × 每年12次 × 3年 | 1亿8,000万韩元 |
| 阻止应对 | 每次 200万韩元 × 每年6次 × 3年 | 3,600万韩元 |
| 内部管理(PM 工时) | 每月50万韩元 × 36个月 | 1,800万韩元 |
| 总计 | 2亿2,200万韩元 |
※ 结构更改应对成本(每次300万韩元)是简单修改100万韩元~大规模重做500万韩元的中间值。实际上会根据复杂度而变化。
HashScraper 订阅制(标准)
| 项目 | 计算依据 | 3年总计 |
|---|---|---|
| 订阅费 | 每月500万韩元 × 36个月 | 1亿8,000万韩元 |
| 初始开发·变更应对·阻止应对 | 全部包含 | 0韩元 |
| 内部管理 | 指定专门经理 | 0韩元 |
| 总计 | 1亿8,000万韩元 |
→ 3年节省:4,200万韩元(19%)
"19%不算多吧?" 是的。从金额上来看是这样。
但这个计算中漏掉了三个方面。
数字无法捕捉的三个差异
1. 可预测性
| 月份 | 外包 | 订阅制 |
|---|---|---|
| 1月 | 0韩元(无问题) | 500万韩元 |
| 2月 | 800万韩元(结构更改2次) | 500万韩元 |
| 3月 | 300万韩元(阻止1次) | 500万韩元 |
| 4月 | 500万韩元(更改 + 阻止) | 500万韩元 |
外包每次问题出现都会导致预算波动。无法制定季度预算。
订阅制每月费用稳定。管理团队可以制定预算。
2. 响应速度
外包: 问题接收(1~2天) → 估价(2~3天) → 批准(1~2天) → 工作(3~7天) = 7~14天
订阅制: 自动检测(几分钟) → 立即响应(当天) → 完成(24小时内) = 1天内
响应速度差异为 7~13天。如果竞争对手价格监控停止2周,期间竞争对手的价格变动将全部错过。这不会反映在TCO中,但会反映在销售额中。
3. 合同结束风险
通过外包制作的爬虫在合同结束后会出现问题:
- 代码所有权: 合同中经常没有明确规定
- 更换供应商: 新供应商难以接手前供应商的代码
- 移交: 在转换期间会出现数据空缺
订阅制在下个月取消即可。如有需要,可以重新订阅。不存在代码所有权争议。
"月费用300万韩元让人难以承受"
是的。并非所有公司都能立即使用月费用300万韩元。
因此有 信用计费。
| 类别 | 信用 | 订阅制 |
|---|---|---|
| 月费用 | 3万~28万韩元 | 300万~1,200万韩元 |
| 方式 | 按使用计费 | 月固定费用全包 |
| 适合情况 | 小规模·不定期采集 | 大规模·常规采集 |
| 初始费用 | 0韩元 | 0韩元 |
| 维护费用 | 包括 | 包括 |
信用 vs 外包:相同工作,差30倍
比较采集1个小规模(简单网站,每月1次采集)的情况:
- 外包: 初始开发费用300万~500万韩元 + 单独维护合同
- 信用: 月费用3万~10万韩元,维护费用包含
如果外包最低价格为300万韩元,用同样的钱可以使用信用 2年半。
随着采集量增加,信用费用超过每月30万韩元后,可以考虑转为订阅制。不需要从一开始就做出重大决定。
根据情况推荐
| 情况 | 推荐 | 原因 |
|---|---|---|
| 一次性采集(研究、活动) | 外包 | 无需维护 |
| 1~2个网站,每月1~2次 | 信用 | 从每月3万韩元开始,轻松入手 |
| 想先试一试 | 信用 | 立即开始 |
| 3个以上网站,每日采集 | 订阅制 | 额外爬虫免费,专属经理 |
| 数据空白影响销售 | 订阅制 | 24小时内故障处理 |
大多数 B2B 数据采集是 "持续性" 的。价格监控、竞争对手分析、新闻采集。不是一次性的工作。
从外包转为订阅制的公司故事
"我们在2年内更换了3次外包公司。每次都是同样的模式。一开始做得好,到了维护阶段反应变慢,最终又换了。选择 HashScraper 不是因为'更好',而是因为'想摆脱这种循环'。"
— 电子商务 C 公司数据团队负责人"我将外包费用年度总结后发现比订阅制还要昂贵。加上估价、批准、PM 的审核时间,根本无法比较。现在这个 PM 负责数据分析。"
— 金融 F 公司 CTO
最终比较表一览
| 比较项目 | 项目外包 | 信用 | 订阅制 |
|---|---|---|---|
| 初始费用 | 1,000万~5,000万韩元 | 0韩元 | 0韩元 |
| 月费用 | 不规则 | 3万~28万韩元 | 300万~1,200万韩元 |
| 额外爬虫 | 新合同 | 信用扣除 | 免费 |
| 结构更改应对 | 额外估价(300万韩元~) | 包含 | 包含 |
| 阻止应对 | 额外估价(200万韩元~) | 包含 | 包含 |
| 响应速度 | 7~14天 | 24小时内 | 24小时内 |
| 预算预测 | 不可能 | 可能 | 可能 |
| 代码所有权 | 需协商 | 无 | 无 |
| 适合规模 | 一次性 | 小规模·不定期 | 大规模·常规 |
开始吧
如果需要爬虫,但不知从哪里开始,最快的方法是 用信用试运行一个项目。
- 立即开始
- 从每月3万韩元开始
- 包含维护
- 规模扩大后再考虑转为订阅制
用信用开始 →
咨询订阅制 →
HashScraper — 不要把爬虫外包,订阅数据吧。




