为何要学习 ComfyUI?

为何要学习 ComfyUI?

在 AI 生图领域,有非常多的产品,比如 Midjourney,Stability AI 等等。为何要学习 ComfyUI 呢?

Midjourney VS ComfyUI

在回答这个问题之前,我觉得有必要介绍下目前市面上的各种 AI 生图产品,或者是 AI 生视频产品。在我的眼里,他们主要分成两大类:

  1. 模型与产品融合的产品,比如 Midjourney,Stability AI 等等。
  2. 模型与产品分离的产品,比如 SD Web UI、ComfyUI 等等。

这两类产品的优劣势如下:

融合产品(如 Midjourney,Stability AI 等)分离产品(如 SD WebUI,ComfyUI 等)
学习成本低,产品一般对 UX 进行优化,且会配套各种教程。高,产品一般多为开源产品,涉及多个开发者。UX 可能没有优化,且缺少教程。
迁移成本高,当你切换一个产品时,需要重新学习产品的使用方法,同时还需要重新学习与模型相关的知识。低,只需要重新学习模型相关的知识。
自由度低,产品一般都是封闭的,你只能使用产品提供的功能。高,产品一般都是开源的,你可以自由地修改产品,甚至可以自己开发产品。
费用高,一般没有本地运行版本,都需要付费。中,一般都会提供本地版本,如果你使用的是本地版就不需要付费,但你可能需要购置 GPU。

不难发现,这两类产品没有哪类产品拥有绝对的优势。选择哪款产品,完全取决于你的需求。

如果你只是当成娱乐,想要时不时制作一些图片或视频,那么,我推荐你选择融合产品。 因为它的学习成本低,你可以很快地学会如何使用,而且它的产品功能也比较完善,你可以很快地制作出一些图片或视频。

但如果你是设计师,或者你想靠 AI 这个新的技术赚钱,那么,我推荐你选择分离产品。 为什么呢?我觉得很多人选择学习何种软件时,很容易忽略两个原因。

首先是迁移成本。

如果我们选择学习第一种融合产品,那就意味着我们在学习软件的同时,还会跟模型绑定。拿 Midjourney 为例,当你学习 Midjourney 的时候,你需要学习软件如何使用,同时还要学习如何更好地使用模型,即如何写好 prompt。同时,它的产品功能也跟模型融合得比较深,有些功能是它这个模型特有的,当你学会后,你就只能在 Midjourney 上使用,而不能在其他产品上使用。

这会导致了一个非常高的学习迁移成本。当你想要更换产品的时候,你需要重新学习新产品的使用方法,同时还需要重新学习与模型相关的知识。

如果这个行业发展的速度比较慢的话,这个成本还可以接受(因为你有足够的时间去学习)。但是,现在 AI 行业发展非常快,每个月都会有新的产品,亦或者新的模型出现。你很难有时间去学习每一个产品。举个实际的例子,如果你选择学习融合产品,意味着:

  • 当你看到 AI 能通过输入文字的方式生成图片,你可能会去学习 Midjourney,Stability AI,甚至 Adobe 的 AI 产品。
  • 然后你又发现好像又有新的产品可以通过画图的方式生成图片,你可能又会去学习 Krea。
  • 接着你发现 AI 还能生成视频,你又跑去学习 Runway、Pika。

最后你会发现,你好像学会了一堆软件,但又好像什么都没学会。因为每一款软件你都需要付出足够长的时间,才有可能真正学会,纯粹探索性的学习是不会有任何的积累(除非你只想娱乐一下)。

而学习分离产品,则能大大地降低这个迁移成本。当有一个新的模型出现时,你只需要切换模型就好了,而不需要重新学习产品的使用方法。比如,你学会了类似 SD WebUI 或者 ComfyUI 这类产品,你学会了如何文生图,当你需要通过画图的方式生成图片,你也只需要切换一些模型,或者在产品里操作一下就能实现与 Krea 类似的效果。

另一个关键是自由度。

我一直有这样的一个观点:AI 不会淘汰人类,但它会淘汰不会使用它们的人类。

你如果想要从 AI 这波浪潮里脱颖而出,你就需要学会如何使用 AI。而且不是单纯地使用 AI。你还需要学会如何调整 AI,从而让它切合你的工作流,甚至改造你的工作流。

因为它的自由度高,你可以自由地修改产品,甚至可以自己开发产品。这意味着你可以将产品与你的工作流结合,从而提高你的工作效率,甚至改造你的工作流。

SD Web UI VS ComfyUI

那市面上也有很多分离型产品,为何选择 ComfyUI?

我们先来简单看看 SD Web UI 和 ComfyUI 的 UI 界面,你应该就能知道它们的区别了。


从上图中可以看到,SD WebUI 的 UI 更像是我们传统使用的产品,有很多输入框,还有多个按钮。而 ComfyUI 的 UI 界面则非常复杂,除了输入框,还有很多一块块的东西,并且还有很多复杂的连线。

的确,从学习成本来看,ComfyUI 的学习成本会比 SD WebUI 高。但是这种连线其实并不复杂,你可以这么理解:

  • 这些小的方块跟 SD WebUI 的输入框和按钮是一样的,都是对参数进行配置。
  • 连线有点像在搭建一个自动化的工作流,从左到右依次运行。
  • 从功能的角度看,其实两个产品截图所提供的功能是一样的,只是 ComfyUI 变成了这种连线的方式。

这这种方式有很什么好处了?我们一起来看看这两个用 ComfyUI 搭建的工作流:


对比两个工作流,你会发现它只是有一个节点不一样,一个是直接加载图片,一个是通过画板绘制图片。这样就实现了两个不同的功能(一个是导入图片生图,一个是绘图生图)。这就意味着,你可以通过改变节点的方式来改变工作流,从而实现不同的功能。这样做有两个好处:

  • 你可以根据自己的需求搭建适合自己的工作流,而不需要依赖开发者。
  • 你也可以根据自己的需求,去开发并改造某个节点。

所以,选择 ComfyUI 最核心的原因就在于它的自由和拓展。那这就意味着你可以自己调整 ComfyUI 从而让它切合你的工作流,甚至改造你的工作流。

在现在这种 AI 发展如此迅猛的时代,我认为保持灵活才是最重要的。

💡

如果你看各种对比评测,还会发现 ComfyUI 在性能上会比 SD WebUI 更好,但在能力的覆盖上会比 SD WebUI 要差,比如 ComfyUI 的 Inpainting 的编辑器就比 SD WebUI 的编辑器要差。但是,这些都不是问题,这些问题未来会依托开源生态逐步完善,或者说互有优势。但是我认为 SD WebUI 不进行非常大的改变的情况下,是无法实现 ComfyUI 那样的自由度的。

你可以订阅我们的 newsletter 以及公众号,或者加入 Discord,以获取最新的教程。