今年MICCAI刚开完,poster session发现一个和我之前实验motivation相似但做法完全不同的工作。东南亚小哥有点口音,给我很热情的解释,聊了半天终于给我看明白了。
文章名为《Point-Unet: A Context-Aware Point-Based Neural Network for Volumetric Segmentation》
他的工作也是觉得现在的主流显卡无法直接处理高分辨的3D医学图像,因此需要通过一定的方法将输入的信息进行一定程度的筛选。不同于我们将输入图像下采样然后在网络设计中引入超分辨进行高频信息还原,他的想法是把3D分割问题转换成点云分割。
他的做法是首先通过一个attention网络对输入图像每个像素点可能是肿瘤的可能性进行初步的判断(不过有一说一这一步的显存占用是怎么降低下来的呢,难道还是用patch吗,当时忘记问了),然后通过不同的可能性数值来进行不同密度的点云采样,这样疑似区域的点云采样会很密集,而安全区域的采样则极度稀疏,从而降低了输入信息对显存的占用。
然后,他们设计了一个用于点云分割的unet,来对输入的点云进行细类分割。当时我一直问他为什么要弄成two-stage,这不是一个网络就能完成吗?后来他跟我解释说第一步的attention网络只输出肿瘤概率,不会进行WT,ET和TC的具体类别分割,因此只能靠第二个网络再去细分类别。