Yuya Yamamoto, Juhan Nam, Hiroko Terasawa
https://arxiv.org/pdf/2206.12230
歌唱技术是利用音色、音高和声音的其他成分的时间波动来进行富有表现力的声乐表演。它们的分类是一项具有挑战性的任务,这主要是因为两个因素:1)歌唱技术的波动种类繁多,受多种因素的影响;2)现有数据集不平衡。为了解决这些问题,论文开发了一种新的基于变形卷积的音频特征学习方法,利用类加权损失函数对特征提取器和分类器进行解耦训练。实验结果表明:1)可变形卷积提高了分类效果,特别是应用于最后两层卷积时;2)对分类器进行再训练,并通过平滑的反频率加权交叉熵损失函数,提高了分类性能。
Nikita Vladimirov, Ekaterina Brui, Anatoliy Levchuk, Vladimir Fokin, Aleksandr Efimtcev, David Bendahan
https://arxiv.org/pdf/2206.11127
软骨缺失的检测对骨关节炎和类风湿关节炎的诊断至关重要。到目前为止已有大量关于关节磁共振图像软骨评估的自动分割工具的论文。与膝关节或髋关节相比,腕关节软骨的结构更为复杂,针对大关节开发的自动工具无法用于腕关节软骨的分割。但是全自动腕关节软骨分割方法具有很高的临床价值,所以论文通过优化U-Net架构的深度和增加注意层(U-Net_AL),评估了U-Net架构的四种优变体的性能。并·将相应的结果与之前设计的基于patch的卷积神经网络(CNN)的结果进行比较。分割质量的评估基于使用几种形态学(2D DSC、3D DSC、精度)和体积指标与手动分割进行的比较分析。这四种网络在分割的同质性和质量上都优于基于patch的CNN。U-Net_AL计算的三维DSC中值(0.817)显著大于其他网络计算的相应三维DSC值。此外U-Net_AL CNN提供了最小的平均体积误差(17%)和相对于真实值最高的Pearson相关系数(0.765)。使用U-Net_AL计算的再现性比手动分割的再现性更大。带有附加注意力层的U-net卷积神经网络提供了最佳的手腕软骨分割性能。为了在临床条件下使用,经过训练的网络可以对代表一组特定患者的数据集进行微调。
完整文章:
https://avoid.overfit.cn/post/518cdba7f3174604bb8236cee180e353