1. 引言
近年来,随着大众健康意识的增强、内镜检查的普及以及超声内镜技术的不断发展与完善,消化道粘膜下肿瘤(SMT)的检出率逐年上升。超声内镜 [1] (EUS)具备超声和内镜双重检查的优势,可以通过内镜清晰地观察粘膜下肿瘤的外部形态,并通过小探头超声对肿瘤进行扫描,以此获得超声图像。当超声波脉冲在组织中传播并与组织相互作用时,脉冲在多个方向上散射,发生干涉现象,形成散斑。由于生物软组织的密度、弹性等的不均匀性,超声波在人体内不同组织的分布可能存在差异 [2] 。由于散斑的形成依赖于组织,因此对组织的散斑进行建模可以更好地得到组织结构或与区域形态的相关信息,对超声斑点的分析还可以得到额外的非侵入性信息,以此了解体内组织中疾病的存在和类型 [3] 。Zhang等人 [4] 提出医学超声图像中散斑的分布更加倾向于广义的伽马分布。边海丽 [5] 从医学超声图像中散斑产生的原理出发,推理得出医学超声图像中散斑分布为瑞利分布。Tsui等人 [6] 应用斑点模型与活检相比较来表征肝脏疾病。同样是肝脏,Wan等人 [7] 调查了107例患者,发现器官脂肪含量与Nakagami分布参数之间存在显著的正相关。Nasr等人 [8] 使用超声图像区分刚切除的和脱细胞的啮齿动物的肾脏。这些工作表明,量化组织结构的变化,并将它们与斑点特征联系起来是有可能的。消化粘膜下组织的细微变化,无论是区分组织还是检测疾病,都可能反映在斑点上。这样的特征助于肿瘤和正常组织的区分。然而,哪种统计分布能最好地模拟散斑还有待观察。
在本文中,我们将理论和实践相结合,从实际的消化粘膜下组织超声图像出发,使用143个临床患者的真实超声数据,将不同组织斑点的灰度直方图作为概率密度函数,评估五种概率密度模型,得出更加符合实际的消化粘膜下肿瘤和正常消化粘膜的超声图像斑点分布的模型。
2. 研究方法
2.1. 极大似然估计
极大似然估计法是一种常用的统计推断方法,通常被用于根据数据构建概率模型。其基本思想是通过对概率分布的似然函数进行优化,找到最大化该函数的参数值,从而得到最适合数据的概率模型。它的好处在于提供了一种简单而高效的方法,从给定的数据集合中估计出一个恰当的概率模型。它不仅可以处理离散和连续的数据,而且对于大多数常见的分布,都有相应的最优参数值。
假设有一个样本集合
,它们服从某种概率分布。我们要估计这种分布的参数,使得给定数据集合的条件下,概率分布的似然函数最大化。极大似然估计如表1所示。

Table 1. Maximum-likelihood estimate
表1. 极大似然估计
2.2. K-S检验

Table 2. Kolmogorov-Smirnov test
表2. Kolmogorov-Smirnov检验
K-S (Kolmogorov-Smirnov)检验是一种用于检验样本分布与理论分布是否一致的统计方法。该方法广泛应用于各种分布检验和统计分析中,可以用于检验各种常见分布的拟合情况。该方法通过计算两个累积分布函数(CDF)之间的最大距离来评估两个分布之间的差异。
假设有一个来自总体分布
的样本集合
。要检验样本是否来自由
定义的某一理论分布。K-S检验 [9] 如表2所示。
2.3. 拟合优度检验
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数) R2。它表示由模型解释的数据方差占总数据方差的比例,通常取值范围在0到1之间。R2的表达式为:
(1)
其中RSS为残差平方和,TSS为总平方和。而R2取值越接近1,说明模型的拟合效果越好。R2取值越接近0,说明模型的拟合效果越差。
3. 模型
本文选择了五种参数分布模型作为消化粘膜下肿瘤和正常消化粘膜灰度水平的潜在模型。
3.1. 伽马分布
伽马分布是由两个参数控制的连续概率分布,两个参数分别为形状参数
和尺度参数
。伽马分布的概率密度函数模型 [10] 表示为:
(2)
3.2. 对数正态分布
对数正态分布是由两个参数控制的连续概率分布,两个参数分别为对数均值
和对数标准差
。对数正态分布的概率密度函数模型 [11] 表示为:
(3)
3.3. 正态分布
正态分布是由两个参数控制的连续概率分布。两个参数分别为均值
和标准差
。它的概率密度函数模型 [12] 表示为:
(4)
3.4. 瑞利分布
瑞利分布是由一个参数控制的连续概率分布。这个参数为尺度
。参数它的概率密度函数模型 [13] 表示为:
(5)
3.5. 威布尔分布
布威布尔分布是由两个参数控制的连续概率分布,两个参数分别为形状参数
和尺度参数
。它的概率密度函数模型 [14] 表示为:
(6)
4. 实验结果和分析
研究材料的介绍以及数据准备
(a)
(b)
(c)
(d)
Figure 1. Example of ultrasound images (a) Original image 1; (b) Region of interest 1; (c) Original image 2; (d) Region of interest 2
图1. 超声图像例图(a) 原始图像1;(b) 有关区域1;(c) 原始图像2;(d) 有关区域2
(a)
(b)
Figure 2. Histogram with Spikes (a) Histogram with 2 spacing; (b) Histogram with 4 spacing
图2. 带有锐刺的直方图(a) 间距为2的直方图;(b) 间距为4的直方图
超声内镜中的超声探头被安置在内镜前端,在进入消化道时进行实时扫描。由于消化粘膜下肿瘤和正常消化粘膜组织的结构复杂,并且有大量随机分布的散射粒子的存在,导致超声波在传播过程中发生干涉现象,因此在超声图像中形成了亮暗不定的斑点 [15] 。本文采用上海市第六人民医院所提供的消化道粘膜下肿瘤超声图片进行了实验,图片格式为JPG,如图1所示,其中红色区域为肿瘤组织,白色区域为正常组织。我们从上海市第六人民医院共得到消化粘膜下超声图像197张,但由于一些图像质量较低,不能分辨消化粘膜下肿瘤组织,这些图像并未被采用,最后有169张肿瘤图像被用来分析消化粘膜下肿瘤的斑点的分布,有185张消化粘膜下正常组织图像用于分析正常组织的斑点的分布。所有超声图像中,正常组织和肿瘤组织被人工勾画出来,并对这些区域进行了灰度值采样。
本文在将图像超声斑点灰度值统计为直方图时,发现直方图中会出现如图2所示具有显著的锐刺,它们似乎在直方图中大致周期性地出现,每个峰值之后都是一个空的或低计数的灰度值。直方图中出现的这类锐刺(Spikes)的原因如下:锐刺是由于为了s减少机器显示缓冲区的带宽,内部图像压缩和解压缩的结果;锐刺的出现是由于A/D转换结果较差的原因,锐刺是机器中散斑一致算法作用的结果 [16] 。
通过实验发现在补偿锐刺伪影的影响和保留直方图的整体形状之间,间距为16时是一个很好的折衷。因此在处理超声图像斑点噪声像素块直方图的时候,都固定直方图的横轴灰度级为16。下面我们将从超声斑点的直方图出发,探究消化粘膜下正常组织灰阶超声图像中的斑点和肿瘤灰阶超声图像中斑点分布特性。首先,对于消化道粘膜下的正常组织和肿瘤组织的灰度数据进行统计。得到的所有灰度值分为16组,每组16个灰度值。针对每组灰度值,记录其在总灰度值中的比例并绘制直方图。然后,将这16个灰度数据代入五种潜在的概率分布中,通过极大似然估计算出每个概率模型的参数。最后计算并检验这五种拟合后的概率模型的拟合程度。其结果如图3所示。
(a)
(b)
Figure 3. Histogram of fitted ultrasound images of digestive mucosa (a) Histogram of tumor tissue; (b) Histogram of normal tissue
图3. 拟合的消化粘膜超声图像直方图(a) 肿瘤组织直方图;(b) 正常组织直方图
表3给出了不同分布类型拟合正常组织和肿瘤组织的K-S统计量的结果。根据图4和表3数据可以看出,在正常组织和肿瘤组织的对比中,K-S统计量显示出明显的差异,针对肿瘤组织,威布尔分布的K-S统计量最小,为0.0096,明显低于伽马分布、瑞利分布、对数正态分布和正态分布。这说明威布尔分布在描述消化粘膜下肿瘤组织斑点分布时表现比伽马分布、瑞利分布、对数正态分布和正态分布更好。针对正常组织,伽马分布的K-S统计量最小,为0.0065,明显低于瑞利分布、对数正态分布、威布尔分布和正态分布的K-S统计量。这说明伽马分布在描述消化粘膜下正常组织斑点分布时表现比瑞利分布、对数正态分布、威布尔分布和正态分布效果更好。

Figure 4. K-S statistics for different distributions
图4. 不同分布的K-S统计量
表4给出了不同分布类型拟合正常组织和肿瘤组织的R2的结果。由图5和表4数据可以看出,在正常组织和肿瘤组织的对比中,R2显示出明显的差异,针对肿瘤组织,威布尔分布的R2最大,为0.9956,明显高于伽马分布、瑞利分布、对数正态分布和正态分布的R2。这说明威布尔分布在拟合消化粘膜下肿瘤组织斑点分布时表现比伽马分布、瑞利分布、对数正态分布和正态分布更好。针对正常组织,伽马分布的R2最大,为0.9967,略高于对数正态分布的0.9898,并且明显高于瑞利分布、威布尔分布和正态分布的R2。这说明伽马分布在拟合消化粘膜下正常组织斑点分布时表现比瑞利分布、威布尔分布、对数正态分布和正态分布更好。

Figure 5. r-squared for different distributions
图5. 不同分布的R2统计量
综上所述,利用K-S统计量和R2的评价指标,根据表3和表4数据发现威布尔分布在描述肿瘤组织的斑点分布时表现更好,而伽马分布在描述正常组织的斑点分布时表现更好,进一步显示了不同组织的斑点分布存在明显差异。
5. 结论
由于医学超声图像中斑点噪声分布依赖于底层组织,因此利用斑点分布对组织进行区分成为可能。本文利用上海市第六人民医院提供的消化道粘膜下肿瘤超声图片,通过对消化道粘膜下正常组织和肿瘤组织中斑点的概率分布模型进行分析,实验结果表明在消化粘膜正常组织的超声图像中,伽马分布表现出更好的拟合性能,其K-S统计量最小,仅为0.0065,其R2最大,为0.9967。而在消化粘膜肿瘤组织的超声图像中,威布尔分布更为适用,其K-S统计量最小,为0.0096,R2最大,为0.9956。这也显示了不同组织类型在超声图像中的斑点分布特征存在差异,这对于超声图像的组织分割和分类具有重要意义。未来的研究可以进一步探索如何应用这些概率分布模型来增强医学影像分析的质量,以更好地满足患者的医疗需求。