码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • [ICCV-23] DeformToon3D: Deformable Neural Radiance Fields for 3D Toonification


    pdf | code

    • 将3D人脸风格化问题拆分为几何风格化与纹理风格化。
    • 提出StyleField,学习以风格/ID为控制信号的几何形变残差,实现几何风格化。通过对超分网络引入AdaIN,实现纹理风格化。
    • 由于没有修改3D GAN空间,因此可以便捷实现Editing和Animation。

    目录

    摘要

    方法

    Geometry Toonification with StyleField

    Texture Transfer with Adaptive Style Mixing

    Training

    实验

    实验设置

    Comparisons with Baselines

    Applications

    Inversion and Editing

    Animatable Toonification

    Toonification Style Control


    摘要

    • 3D人脸风格化;
    • 3D GAN直接在艺术域(artistic domain)上fine-tuning,效果不错。但存在两个问题:1)会破坏3D GAN原有的隐空间,影响后续的语义编辑;2) 每种新风格需要额外训练,限制了部署。
    • 为了解决上述两个问题,本文提出DeformToon3D。本文方法将3D卡通化(toonification)问题,分解为几何与纹理风格化。
    • 本文提出StyleField,预测条件控制的3D形变(conditional 3D deformation),实现几何风格化;通过3D GAN的decoder实现纹理风格化。

    方法

    • DeformToon3D是一个堆叠模型 G = G1 o G0,其中G1是3D生成器,G2是2D超分解码器。G0输入instance code w和相机位姿\xi,和体渲染输出为中间特征图F。G1将F超分得到高分辨率图片I。
    • 在考虑3D人脸卡通化时,现有方法将G视作一个整体进行fine-tune。DeformToon3D用StyleField作为几何风格化,fine-tune体渲染器实现纹理风格化。

    Geometry Toonification with StyleField

    直接用跨域数据fine-tune G0,计算开销大且会破坏GAN的隐空间。

    假设风格化NeRF是\mathcal{N}_S,真实域NeRF是\mathcal{N}_R。本文冻结G0参数,并提出StyleField模块学习\mathcal{N}_S到\mathcal{N}_R的映射关系。

    具体来说,假设\mathcal{N}_S中的任意3维点x_S,StyleField学习x_S到\mathcal{N}_R中x_R的映射关系:

    其中,H_D是StyleField,受style code w_S和instance code w_R控制,前者决定风格,后者决定3D face的ID。

    H_D由4层SIREN组成,支持多种风格变换。相较于直接fine-tune G0,优化参数量减少了50%,同时还保留了3D GAN原有隐空间。在10种风格情况下,相较每种风格fine-tune一个G0,节省了98.5%的存储空间。

    Texture Transfer with Adaptive Style Mixing

    G0和StyleField实现了风格的几何变换。在此基础上,本文在超分网络G1实现风格的纹理变换。

    G1是2D style-based architecture。本文通过AdaIN来逐步调整图片风格。

    受style mixing启发,通过混合G1网络参数和目标风格w_S,实现纹理信息的注入。

    本文同时添加了一个轻量级MLP T,输入为w_S、w_R和w,调整风格强度。

    Training

    本文通过DualStyleGAN产生2D风格图像;

    训练中,使用LPIPS loss作为重建损失;使用smoothness,确保H_D是物理平滑的;同时,使用了GAN的对抗训练损失。

    实验

    实验设置

    • Datasets:测试了10种风格:Pixar, Comic, Slam Dunk, The Croods, Fiona (Shrek), Rapunzel (Disney Princess), Hiccup Horrendous Haddock III (How To Train Your Dragon), and three different carica-ture styles;在CelebA-HQ上测试;
    • Model:使用在FFHQ上预训练的StyleSDF作为3D GAN;
    • Training:在8张V100上训练了24小时,bs=16;
    • Baselines:和CIPS-3D、E3DGE、StyleGAN-NADA进行比较

    Comparisons with Baselines

     

    Applications

    Inversion and Editing

    使用E3DGE实现3D GAN inversion

    Animatable Toonification

    学习3DMM参数和3D GAN隐空间的双向映射关系。通过驱动视频拿到3DMM参数的变化,并映射回3D GAN中

    Toonification Style Control

  • 相关阅读:
    《第一行代码》核心知识点:Activity(活动)
    ArduPilot添加新的惯导方案
    【libGDX】ApplicationAdapter生命周期
    org.springframework.transaction.annotation.Transactional 简单使用示例
    牛客前端宝典——刷题 ##Day13
    net-java-php-python-会议管理系统计算机毕业设计程序
    OpenCL编程指南-9.3使用事件完成评测、内核中的事件、OpenCL外部的事件
    代码随想录算法训练营第38天—动态规划06 | ● 完全背包 ● *518. 零钱兑换 II ● 377. 组合总和 Ⅳ
    现代信号处理——其他谱估计方法(最大熵谱估计)
    红日靶场五(vulnstack5)渗透分析
  • 原文地址:https://blog.csdn.net/qq_40731332/article/details/133685714
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号