AI Weekly 006

AI Weekly #006

🆕 更新了什么?

产品更新:


  • 我们在模型 Tab 和 Tutorial Tab 增加了更多的引导,以帮助大家能更快上手我们的产品。

  • 为了提高安装插件的体验,我们增加了 Pip Install 入口。

  • 与此同时我们还修复了不少 bug,提升了安装成功率。

新增教程:

网站也同步更新了以下文章:

  1. Comflowy 新手入门 (opens in a new tab)
  2. 10 个值得下载的模型 (opens in a new tab)
  3. 如何选择合适的模型? (opens in a new tab)

🤩 每周 AI 精选

📄 值得关注的论文 & 技术

这是苹果开源的一个图像编辑模型,用户可以通过文字提示来编辑任何图像。比如说,“让天空变成粉红色”,或者“在这张照片中加一个恐龙”。模型会根据命令实现改变图片颜色,添减物体或调整、移除图片中的某些元素等操作。


它能按照人类指令进行高质量图像恢复,包括去噪、去雨、去模糊、去雾以及(低光)图像增强等问题。你只需要使用文字描述就能修复和改善图片。比如说,如果你有一张因为雨滴而看起来模糊的照片,你可以告诉它:请去掉照片上的雨滴,但保持图片内容不变”,它就能自动帮你操作。


Gemini Pro 将支持包括中文在内超过 40 种语言和 230 多个国家和地区使用,产品新增图像生成功能和多语言双重检查功能。只需输入描述,例如“创建一只骑着冲浪板的狗的图像”,即可生成对应的图片。


Media2Face 能够根据声音来生成与语音同步的、表现力丰富的 3D 面部动画。同时允许用户对生成的面部动画进行更细致的个性化调整,如情感调整,“快乐”或“悲伤”等。它还能理解多种类型的输入信息(音频、文本、图像),并将这些信息作为生成面部动画的指引。


Boximator 是一个控制视频主体运动轨迹的产品。字节发布的方法是,先圈出图片中的主体,再圈出要移动到位置,即可生成主体从起点到终点移动的视频,支持设置移动路线,支持圈选多个主体。与 SD 视频模型兼容,可作为插件使用。暂无体验网站,目前可以发邮件让项目方给生成视频。


🛠️ 值得尝试的产品

这是一个无代码 AI 图像生成和分析工作流平台,主要解决在电商领域遇到的批量处理图片问题。它提供了一个拖放式的界面,允许用户轻松地创建复杂的图像处理工作流。


它能通过你上传或粘贴的任何文档内容,提供在线链接,帮你朗读在线文章,目前支持五种声音选择。


Galileo 支持文字生成 UI 和图片生成 UI,效果很不错。


Clipdrop 神器能为你轻松搞定抠图烦恼,无论毛发还是细节都能完美抠出。上传图片,一抹即净,马赛克图片也能瞬间变高清。


你可以订阅我们的 newsletter 以及公众号,或者加入 Discord,以获取最新的教程。