当前位置:首页>科技 >内容

x光胸片能看出脂肪肝吗,斯坦福携手MIT发布巨大量级X光胸片数据集

2023-11-13 18:51:02科技漂亮的斑马

很多朋友对x光胸片能看出脂肪肝吗,斯坦福携手MIT发布巨大量级X光胸片数据集不是很了解,六月小编刚好整理了这方面的知识,今天就来带大家

x光胸片能看出脂肪肝吗,斯坦福携手MIT发布巨大量级X光胸片数据集

很多朋友对x光胸片能看出脂肪肝吗,斯坦福携手MIT发布巨大量级X光胸片数据集不是很了解,六月小编刚好整理了这方面的知识,今天就来带大家一探究竟。

今天,吴恩达发布了斯坦福大学发布的两个大型医疗数据集:CheXpert和MIMIC-CXR。其中,CheXpert包含224316张x光胸透图片,MIMIC-CXR包含371920张标记图片。两个数据集的数据量级和标注准确率都非常高,可以说惠及了大量相关从业者。数据集下载方式首先给出数据集介绍的地址和下载方式。https://stanfordmlgroup.github.io/competitions/chexpert/

因为是医学数据集,斯坦福采取了相对谨慎的态度。根据说明,用户需要遵循下载规则,填写信息,通过邮件给出的链接下载。为了维护数据集的完整性和有效性,严禁“滥用”共享。数据集概述

CheXpert数据集包含224,316张胸部x光片,涉及65,240名患者。数据集的时间跨度为2002年10月至2017年7月,均为斯坦福医院胸透检查后的患者保存。此外,数据集附有相关的放射学报告。如何标注CheXpert数据集每份报告标注14个观察值,可能是正面的,也可能是负面的,也可能是不确定的。

根据报告的患病率和临床相关性,并根据Fleischner学会推荐的术语表(如适用),确定了14项观察结果。此外,还开发了一个基于规则的自动贴标机,用于从放射学报告中提取观察结果,并将其用作图像的结构化标签。标注机器的工作分为三个不同的阶段:提及抽取、提及分类和提及聚合。自动贴标机github地址:https://github.com/stanfordmlgroup/chexpert-labeler

在提及提取阶段,贴标机从放射学报告的“印象”部分的观察列表中提取提及,该报告总结了放射学研究中的关键发现。在参考文献的分类中,按每个参考文献进行分类,观察到的分为负面、不确定或正面。在引用聚合阶段,使用每个观察值的分类,将获得14个观察值的最终标签。基准模型

基准模型将单视图胸部射线照片作为输入,并输出14次观察中每一次的概率。当多个视图可用时,模型给出最大概率。使用不确定度的数据集中训练数据集的标签分别为0、1或u。其中0为负,1为正,u不确定。在模型训练中,使用不同的不确定性标记方法。U-Ignore:训练时忽略不确定的标签。u-zeros:将不确定标签的所有实例映射到0。

u-one:将不确定标签的所有实例映射到1。U-自训练:首先用U-Ignore方法训练模型收敛,然后用模型预测,用模型输出的概率预测重新标注每个不确定性标签。U-MultiClass:将不确定性标签作为自己的类别对待。

重点评估五项观察,进行“竞争性任务”。根据临床经验和患病率分为:(a)肺不张,(b)心脏增大,(c)肺实变,(d)水肿,(e)胸腔积液。通过比较不同不确定度方法在200项研究的验证集中的表现,三位放射科医生的笔记被用作基本事实。

根据验证集中每个竞赛任务的最佳性能方法选择基准模型:用于肺不张和水肿的U-one,用于心脏增大和胸腔积液的U-MultiClass,以及用于肺实变的U-SelfTrained。

如何设计测试集CheXpert中的测试集由来自500名“未知”患者的500张胸部x光片组成。八位权威的放射科医生对测试集中的每张图片都进行了注释。他们将每张图片标记为:存在、不确定、不可能和不存在。

然后将标签二值化,将存在和不确定的情况视为正例,将缺失和不可能的情况视为负例。根据五位专家的投票确定图片标签,然后用剩下的三位专家来检验五位专家的表现。基准模型在测试集上的表现如何?

该模型对胸腔积液的AUC最好(0.97),对肺不张的AUC最差(0.85)。所有其他观察值的AUC至少为0.9。该模型在心脏增大、水肿和胸腔积液方面取得了比所有三位放射科医生更高的性能,但这不是他们的多数投票。在肺实变方面,模型的表现优于三个放射科医生中的两个,而在肺不张方面,三个放射科医生都优于模型。与麻省理工学院联合发布模拟CXR数据集

此外,与MIMIC-CXR公司联合发布了一个包含371,920幅胸部x光图像的大型数据集。这个数据集的时间跨度是从2011年到2016年。这些数据与贝斯以色列女执事医疗中心的227,943项成像研究相关。每个成像研究可能包含一个或多个图像,但通常有两个图像:前视图和侧视图。相关论文下载地址:https://arxiv.org/pdf/1901.07042.pdf.

这些图像具有14个标签,它们来自放射学报告的自然语言处理工具。CheXpert数据集和MIMIC-CXR共享一个通用的贴标机,CheXpert贴标机,用于从放射学报告中获取相同的标签集。最终展望

胸部X线判读模型发展的障碍之一是缺乏具有强放射科医生对地面真实性的评论和专家评分的数据集。研究人员可以根据这些数据比较他们的模型。希望CheXpert填补这个山谷,以便在临床重要任务中随时跟踪模型的进展。

此外,吴恩达团队还开发并开放了CheXpert标记机,这是一种基于规则的自动标记机,用于从自由文本放射学报告中提取观察结果,并将其作为图像的结构化标签。我们希望这可以帮助其他机构轻松地从报告中提取结构化标签,并发布其他大型数据库,用于医学成像模型的跨机构测试。

最后,斯坦福还做了一个展望,希望这个数据集可以帮助开发和验证胸部x光的解释模型,从而提高全球医疗服务的获取和交付。

以上就是关于x光胸片能看出脂肪肝吗,斯坦福携手MIT发布巨大量级X光胸片数据集的知识,希望能够帮助到大家!

声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们

Top