码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • [论文精读]U-Net: Convolutional Networks for BiomedicalImage Segmentation


    论文原文:U-Net: Convolutional Networks for Biomedical Image Segmentation (arxiv.org)

    英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏向于笔记,谨慎食用!

    目录

    1. 原文逐段精读

    1.1. Abstract

    1.2. Introduction

    1.3. Network Architecture

    1.4. Training

    1.4.1. Data Augmentation

    1.5. Experiments

    1.6. Conclusion

    2. 代码

    3. 知识补充

    3.1. Bicubic interpolation

    4. Reference List


    1. 原文逐段精读

    1.1. Abstract

            ①Reasonable use of annotation samples

            ②"The architecture consists of a contracting path to capture context and a symmetric expanding path that enables precise localization"

            ③This model is for segmenting neuronal structures in electron microscopic stacks

            ④This model peforms great in small training sample 

    1.2. Introduction

            ①The expectations for machine learning and deep learning in medicine often lie not in classification accuracy, but in region segmentation and other aspects

            ②They consider the sliding-window model by Ciresan et al. as slow in training and inaccuracy brought by maxpooling

            ③⭐U-Net takes upsampling instead of pooling

            ④什么重叠贴图策略??我没能明白,为啥这样就能预测

            ⑤They use elastic deformations to augment there data, which keeps the invariance

    1.3. Network Architecture

            ①The whole framework: 

            ②3*3 convolutions include no padding

            ③Stride of maxpooling is 2

            ④Double the number of channels when downsampling

            ⑤Up-conv 2*2 halves the number of feature channels

    1.4. Training

            ①Momentum: 0.99

            ②Softmax function: 

    p_{k}(\mathbf{x})=\exp(a_{k}(\mathbf{x}))/\left(\sum_{k^{\prime}=1}^{K}\exp(a_{k^{\prime}}(\mathbf{x}))\right)

    where a_{k}\left ( \textbf{x} \right ) is activation in the k feature channel at the \textbf{x} pixel position

            ③Cross entropy function: 

    E=\sum_{\mathbf{x}\in\Omega}w(\mathbf{x})\log(p_{\ell(\mathbf{x})}(\mathbf{x}))

    where \ell\in \left \{ 1,...,K \right \} denotes true label of every pixel, w denotes weight map

            ④Weight map:

    w(\mathbf{x})=w_c(\mathbf{x})+w_0\cdot\exp\left(-\frac{(d_1(\mathbf{x})+d_2(\mathbf{x}))^2}{2\sigma^2}\right)

    where w_{c} is balacing weight map, d_{1} denotes the distance to the nearest cell border, d_{2} denotes  the distance to the second nearest cell border

            ⑤Initialization: w_{0}=10, \sigma \approx 5

            ⑥Setting of weights: standard deviation is \sqrt{\frac{2}{N}}, where N is the number of incoming nodes of one neuron

    1.4.1. Data Augmentation

            ①Shift and rotation invariance are needed for robustness, especially random elastic deformations of the training samples are important to segmentation

            ②"They generate smooth deformations using random displacement vectors on a coarse 3 by 3 grid"

            ③Then compute bicubic interpolation to get per-pixel displacements

    1.5. Experiments

            ①Segmentation tasks: segementing neurons in electron microscopic recordings and light microscopic images and 

            ②Dataset: EM segmentation challenge

            ③Evaluation criteria: warping error, Rand error and pixel error

            ④The ranking of the EM challenge:

            ⑤The accuracy of ell segmentation task in light microscopic images:

    1.6. Conclusion

            There is small sample needed for U-Net. In addition, it has short training time and high accuracy.

    2. 代码

    相关链接:深度学习-UNet - 知乎 (zhihu.com)

    3. 知识补充

    3.1. Bicubic interpolation

    (1)相关链接1:最近邻插值、双线性插值与双三次插值 - 知乎 (zhihu.com)

    (2)相关链接2:双三次插值(BiCubic插值)-CSDN博客

    4. Reference List

    Ronneberger, O., Fischer, P. & Brox, T. (2015) 'U-Net: Convolutional Networks for Biomedical Image Segmentation', MICCAI 2015: Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015, pp 234–241. doi: U-Net: Convolutional Networks for Biomedical Image Segmentation | SpringerLink 

  • 相关阅读:
    基于第二代 ChatGLM2-6B P-Tuning v2 微调训练医疗问答任务
    18.4 【Linux】systemd-journald.service 简介
    FileChannel 文件流的简单使用
    民宿管理系统的分析与设计
    SpringBoot自带序列化工具Jackson如何做到序列化忽略某个字段,反序列化忽略某个字段???
    SpringCloud笔记之Rest环境搭建
    【英语:基础进阶_听口实战运用】D5.听力对话训练
    程序员『天梯排行榜』,看看你在哪一级?
    Vue笔记(三)
    产品经理专业知识50篇(三)-如何寻找用户增长的根本动因
  • 原文地址:https://blog.csdn.net/Sherlily/article/details/133624115
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号