Vibe Coding 挑战 | 证件照制作工具

引言

在日常生活中，我们常常需要应对各种证件照要求——不同的尺寸、背景颜色、DPI（每英寸点数）标准等。每次准备证件照，要么得跑打印店，要么只能依赖付费的在线服务，既费时又不便。

作为一个对该领域完全陌生的人，我不禁思考：是否可以借助 AI 技术，自己动手打造一款简单易用的证件照制作工具？带着这个疑问，我发起了本次 Vibe Coding 挑战。

我从中学到了什么？

1. AI 能帮助快速入门陌生领域，厘清核心问题

我对证件照制作一无所知：既不清楚 DPI、照片尺寸、排版规范、打印机设置等基本概念，也不了解实现这类工具的技术路径和难点所在。

为此，我设计了一个头脑风暴提示词，借助 AI 进行结构化探索。通过多轮对话，我不仅厘清了相关术语，还识别出该领域的核心挑战——精准的背景消除，并初步筛选出潜在的技术方案（如 U-2-Net 模型）。最终，AI 协助我输出了一份产品概念文档，为后续的需求分析和开发奠定了基础。

2. 对 AI 提供的信息需保持审慎，尤其在缺乏领域知识时

由于完全不熟悉该领域，我无法独立验证 AI 所提建议的准确性。例如，AI 推荐结合 TensorFlow.js 与 U-2-Net 模型实现背景消除。这两个项目确实存在，于是我一度深信其可行性。

然而，在实际开发中，GitHub Copilot 始终无法生成有效代码。深入调研后才发现：U-2-Net 基于 PyTorch 构建，无法直接在浏览器环境中运行；而 TensorFlow.js 虽支持前端部署，却不兼容 U-2-Net 的模型结构。这一误判导致开发一度停滞。

这类问题难以完全避免——在没有专家支持的情况下，AI 往往是我们探索新领域的首要工具。但我们可以通过建立验证机制（如参考《如何处理未知问题？》中的方法）来降低风险，并构建快速反馈循环，及时修正方向。

3. 非常规技术难点，仍需人类主动攻坚

证件照制作的核心技术瓶颈在于高质量的背景消除。尽管 U-2-Net 效果出色，但其依赖 Python 和 PyTorch，无法直接用于纯前端应用。而 TensorFlow.js 虽能在浏览器运行，却缺乏对 U-2-Net 的支持。GitHub Copilot 在此场景下直接“放弃”，既无法实现原方案，也提不出可行替代。

面对这一僵局，我只能主动介入：通过 AI 探索新思路，再用 Google 验证技术可行性，反复测试不同方案，最终找到一条可落地的路径，并据此指导 AI 生成有效代码。
本质上，这个关键难点是我自己解决的——如果无法突破，整个项目将止步于此。