基于LDA主题模型的软件缺陷分派方法

admin•2025-03-22 16:38:20•系统教程•阅读59

基于LDA主题模型的软件缺陷分派方法

2024年5月15日发(作者：以太网控制器感叹号)

第３７卷　

第２１期　

、，０１－３７　

・

计算机工程　

２０１１年１１月　

Ｎｏｖｅｍｂｅｒ　２０１　１　

ＮＯ．２１　

Ｃｏｍｐｕｔｅｒ　Ｅｎｇｉｎｅｅｒｉｎｇ　

软件技术与数据库・　文章编号：１００ｏ＿３４２８（２ｏｌ１）２１—＿００４６—＿ｏ３　文献标识码：Ａ　中图分类号：ＴＰ３１１　

基于ＬＤＡ主题模型的软件缺陷分派方法　

黄小亮　，郁抒思　，关佶红　

（１．复旦大学计算机科学技术学院，上海２００４３３；２．同济大学计算机科学与技术系，上海２０１８０ｇ）　

摘要：传统的基于向量空间模型的软件缺陷分派方法，由于存在特征空间维度高、数据稀疏且包含噪音等问题，分派准确率较低。为此，　

提出一种基于隐含狄利克雷分配（ＬＤＡ）主题模型的软件缺陷分派方法，将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间，　

在新的低维主题空间上进行分派。实验结果表明，在使用ＳＶＭ和ＫＮＮ分类器时，该方法的分派准确率较高。　

关健诃：软件缺陷分派；隐含狄利克雷分配模型；马尔可夫链蒙特卡洛方法；吉布斯采样；文本分类；向量空问模型　

Ｓｏｆｔｗａｒｅ　Ｂｕｇ　Ｔｒｉａｇｅ　Ｍｅｔｈｏｄ　Ｂａｓｅｄ　０ｎ　ＬＤＡ　Ｔｏｐｉｃ　Ｍｏｄｅｌ　

ＨＵＡＮＧ　Ｘｉａｏ－ｌｉａｎｇ　，ＹＵ　Ｓｈｕ－ｓｉ　，ＧＵＡＮ　Ｊｉ－ｈｏｎｇｚ　

（１．Ｓｃｈｏｏｌ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ，Ｆｕｄａｎ　Ｕｎｉｖｅｒｓｉｔｙ，Ｓｈａｎｇｈａｉ　２００４３３，Ｃｈｉｎａ；　

２．Ｄｅｐａｒｔｍｅｎｔ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ，Ｔｏｎｇｊｉ　Ｕｎｉｖｅｒｓｉｔｙ，Ｓｈａｎｇｈａｉ　２０１　８０４，Ｃｈｉｎａ）　

［Ａｂｓｔｒａｃｔ］Ｉｎ　ｔｒａｄｉｔｉｏｎａｌ　Ｖｅｃｔｏｒ　Ｓｐａｃｅ　Ｍｏｄｅｌ（ＶＳＭ）ｂａｓｅｄ　ｓｏｆｔｗａｒｅ　ｂｕｇ　ｔｒｉａｇｅ，ｔｈｅ　ｈｉｇｈ　ｄｉｍｅｎｓｉｏｎａｌｉｔｙ　ｆｅａｔｕｒｅ　ｓｐａｃｅ　ａｒｅ　ｓｐａｒｓｅ　ａｎｄ　ｎｏｉｓｅ　

ｃｏｎｔａｉｎｉｎｇ．Ｉｎｓｐｉｒｅｄ　ｂｙ　ｔｈｅｓｅ　ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ，ｔｈｉｓ　ｐａｐｅｒ　ｐｒｏｐｏｓｅｓ　ａ　ｓｏｆｔｗａｒｅ　ｂｕｇ　ｔｒｉａｇｅ　ｍｅｔｈｏｄ　ｂａｓｅｄ　ｏｎ　Ｌａｔｅｎｔ　Ｄｉｒｉｃｈｌｅｔ　Ａｌｌｏｃａｔｉｏｎ（ＬＤＡ）ｔｏｐｉｃ　

ｍｏｄｅ１．Ｉｔ　ｍａｐｓ　ｔｈｅ　ｂｕｇ　ｒｅｐｏｒｔ　ｔｏ　ｈｅ　ｔｔｏｐｉｃ　ｓｐａｃｅ，ａｎｄ　ｍａｋｅｓ　ｔｒｉａｇｅ　ｉｎ　ｔｈｅ　ｎｅｗ　ｌｏｗ　ｄｉｍｅｎｓｉｏｎ　ｔｏｐｉｃ　ｓｐａｃｅ．Ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ，ｔｈｅ　ｍｅｔｈｏｄ　

ｗｏｒｋｓ　ｗｅｌｌ　ｏｎ　ｂｕｇ　ｔｒｉａｇｉｎｇ，ｗｉｔｈ　ＳＶＭ　ａｎｄ　ＫＮＮ　ｃｌａｓｓｉｆｉｅｒｓ．　

［Ｋｅｙ　ｗｏｒｄｓｌ　ｓｏｆｔｗａｒｅ　ｂｕｇ　ｔｒｉａｇｅ；Ｌａｔｅｎｔ　Ｄｉｉｆｃｈｌｅｔ　Ａｌｌｏｃａｔｉｏｎ（ＬＤＡ　ｍｏｄｅｌ；Ｍａｒｋｏｖ—Ｃｈａｉｎ　Ｍｏｎｔｅ　Ｃａｒｌｏ（ＭＣＭＣ）ｍｅｔｈｏｄ；Ｇｉｂｂｓ　ｓａｍｐｌｉｎｇ；ｔｅｘｔ　

ｃｌａｓｓｉｉｆｃａｔｉｏｎ；Ｖｅｃｔｏｒ　Ｓｐａｃｅ　ＭｏｄｅＩ（ＶＳＭ）　

ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１０００—３４２８．２０１１．２１．０１６　

１概述　

大规模的开源软件，如Ｅｃｌｉｐｓｅ和Ｆｉｒｅｆｏｘ等，随着规模　

的增大和版本的更新，会有大量的缺陷（ｂｕｇ）被发现和提交。　

由于数量很大，将这些新的缺陷分给合适的开发人员去解　

决，需要大量的人力和时间。软件缺陷分派的目的，就是利　

用缺陷跟踪系统（如Ｂｕｇｚｉｌｌａ）中已解决缺陷的历史信息（包括　

２软件缺陷报告与软件缺陷分派　

２．１软件缺陷报告　

在大型的软件系统中都会有专门的缺陷跟踪系统，以维　

护整个软件系统中缺陷的基本信息和修复情况。缺陷报告是　

记录单个缺陷信息和状态的文本。以Ｅｃｌｉｐｓｅ为例，一个典型　

的缺陷报告中包含缺陷报告编号、出现缺陷的平台、软件版　

本、缺陷状态（是否修复等）、被分派给谁等信息，还有详细　

参与解决缺陷的人员信息），对新提交的缺陷进行自动分派。　

缺陷的自动分派能帮助系统开发与维护人员将宝贵的时间专　

注于缺陷的修复。　

缺陷分派最常用的方法是将每一个缺陷报告看成一个文　

档，提取缺陷文本描述信息，然后用向量空间模型（Ｖｅｃｔｏｒ　

Ｓｐａｃｅ　Ｍｏｄｅｌ，ＶＳＭ）表示软件缺陷，从而将缺陷分派转换成文　

本分类问题来处理。相比于普通的文本分类问题，缺陷分派　

描述缺陷的ｄｅｓｃｒｉｐｔｉｏｎ信息。同时，每个缺陷报告还有一个　

对应的活动Ｅｔ志来保存缺陷报告中信息的修改记录（如状态　

的改变等）。在基于文本分类的缺陷分派方法中，缺陷报告是　

主要信息来源。　

可用信息少，而类别多（每个开发人员相当于一个类别），因　

此分派效果普遍较差，分派准确率低。文献［１］直接将缺陷报　

告表示为单词的集合，使用朴素贝叶斯方法分类，取得了约　

３０％的准确率。缺陷分派最后的类别是开发者，可以有多个，　

２．２基于向量空间模型的软件缺陷分派　

使用基于文本分类的方法来进行缺陷分派时，基本方法　

是使用ｄｅｓｃｒｉｐｔｉｏｎ信息作为文本，修复缺陷的人作为文本的　

类别标签，然后用ＴＦ—ＩＤＦ（Ｔｅｒｍ　Ｆｒｅｑｕｅｎｃｙ—Ｉｎｖｅｒｓｅ　Ｄｏｃｕｍｅｎｔ　

Ｆｒｅｑｕｅｎｃｙ）构建向量空间模型，将每个缺陷报告表示成单词　

空间上的一个向量，再使用分类方法对新的缺陷报告进行分　

文献［２］扩展了文献【１】的方法，根据新缺陷分到每个类的概　

率，取概率最高的ｋ个类（开发人员）组成一个推荐列表，在　

ｋ＝５时使分派给推荐列表的准确率达到６０％左右。此外，文　

类，将其分派给类别对应的开发者。　

向量空间模型利用训练集合中的所有单词来组成一个高　

维空间，每个不同的单词就是空间里的一个维度，每一个文　

档则对应空间里面的一个向量。用ｄｅｓｃｒｉｐｔｉｏｎ里面的文本信　

息来构建向量时，先要把文本分解成一个个的单词。因为文　

基金项目：国家自然科学基金资助项目（６０８７３０４０）　

献【３】还使用隐含语义分析（Ｌａｔｅｎｔ　Ｓｅｍａｎｔｉｃ　Ａｎａｌｙｓｉｓ，ＬＳＡ）来　

将缺陷报告的文本从单词空间映射到“隐含”语义空间，进　

行降维和去噪，然后在新的语义空间上进行分派。　

为提高分派效果，本文提出一种基于隐含狄利克雷分配　

（Ｌａｔｅｎｔ　Ｄｉｒｉｃｈｌｅｔ　Ａｌｌｏｃａｔｉｏｎ，ＬＤＡ）１４］主题模型的方法，即将缺　

陷报告文档从高维的单词空间映射到低维的主题空间，然后　

进行缺陷分派。　

作者简介：黄小亮（１９８５一），男，硕士研究生，主研方向：数据挖　

掘，文本分类；郁抒思，博士研究生；关佶红，教授、博士生导师　

收稿日期：２０１　Ｉ一０４—２６　Ｅ—ｍａｉｌ：ｈｕａｎｇｘｌ＠ｆｕｄａｎ．ｅｄｕ．ｃｎ　

第３７卷第２１期　黄小亮，郁抒思，关估红：基于ＬＤＡ主题模型的软件缺陷分派方法　４７　

本中有很多合成词，所以需要把这样的词分解开，判断的标　

准是小写字母后面跟着大写字母。同时还要剔除停用词和统　

一

大小写，并使用提取词干的方法将不同时态的单词统一起　

来。停用词是指那些出现次数非常多，不具有区分意义的　

词，比如ｏｆ、ｔｈｅ等，通常由一个列表提供。　

确定文档向量在各个维度上的权值时，通常采用ＴＦ—ＩＤＦ　

方法，其基本思想是，某个单词在一篇文章里面出现的次数　

越高，同时在其他文章里面出现的次数越少，则该单词具有　

越好的区别能力。其中，词频指给定的文档ｄ当中单词Ｗ出　

现的次数，为了防止偏向长文件，通常会除以文件总单词　

数。而文档频率则是指整个集合Ｄ中，包含Ｗ的文档个数。　

对于给定的词Ｗ　，它在文本　中的ｔｙ初ｆ　值可表示为：　

＝　㈩　

ｄｆ，＝ｌｂ　（２）　

其中，ｎ　表示单词ｗ　在文本　中出现的次数；ＩＤＩ表示集合　

当中包含的总文件数；Ｉ｛ｄ：　∈ｄ｝ｌ表示集合当中包含单词　

Ｗ　的文件的总数，在求对数的时候，可以选用任意的底数，　

本文使用２作为底数。然后就可以得到词Ｗ　的ＴＦ—ＩＤＦ值：　

一

ａｆ，

，

Ｊ　，，ｘｉｄｆ￣　（３）　

通过计算文档中每个单词的ＴＦ—ＩＤＦ值，就可以得到文　

档最后的向量表示。　

３基于ＬＤＡ主题模型的软件缺陷分派　

３．１　ＬＤＡ模型　

ＬＤＡ是一种对文本建模的方法，它将文档表示成一个由　

文档、主题和词组成的３层概率模型，常被用来做主题分　

析　。ＬＤＡ模型建立在文档是“词袋”（ｂａｇ—ｏｆ－ｗｏｒｄ）的假设　

之上，该假设忽略了单词之间的顺序关系，是可交换的，因　

此，在给定某些参数的情况下，这些单词在文档中就是独立　

同分布的。通过ＬＤＡ建模，可以将文本映射到主题空间上，　

从而对其进行主题分类和判断相似度等操作。　

在构建模型时，ＬＤＡ假设　和　分别先验地服从参数　

为　，　的狄利克雷分布。狄利克雷分布是一种描述多维变量　

概率分布的分布，常用作概率模型中的先验假设，　，∥是预　

设的参数，是一个表示多维变量相互之间权重关系的向量。　

如图１所示，主题在每个文档ｄ上有一个概率分布　，单词　

在每个主题Ｚ上有概率分布　。　

图１　ＬＤＡ模型　

在对文本构建ＬＤＡ模型时，一种推导模型的参数的方　

法是使用吉布斯采样（Ｇｉｂｂｓ　Ｓａｍｐｌｉｎｇ）的马尔可夫链蒙特卡　

洛（Ｍａｒｋｏｖ—Ｃｈａｉｎ　Ｍｏｎｔｅ　Ｃａｒｌｏ，ＭＣＭＣ）方法　Ｊ。该方法对每个　

位置上的单词（将所有文档连成串）分配一个主题，并以此为　

状态空间来构建马尔科夫链，通过Ｇｉｂｂｓ采样来更新节点状　

态（单词的主题），收敛到稳定状态后再用统计规律计算出数　

据集上ＬＤＡ模型概率分布的近似。在构建模型时，ＭＣＭＣ　

方法通常假设模型中的狄利克雷分布是对称狄利克雷分布，　

即口，　中的每个分量都取相同值，于是ａ，　退化为实数帅　

。

采样的具体过程为：　

（１）初始化：为每个位置ｉ上的单词Ｗ　随机分配一个主题。　

（２）更新状态：对于每一个单词　，通过计算在ｉ以外的　

其他所有单词的主题Ｚ．　已知的情况下，Ｗ　属于每一个主题　

的后验概率ｐ（ｚ　，，ｗ）来将当前单词分配给最可能的　

主题。　

（３）迭代步骤（２）足够多次，使每个单词的主题收敛到稳定　

状态。　

一

１＋疗　ｊ一１＋　

ｗ）　ｚ　，ｒ—

一　

ｎ　

ｄ－１　４－ＴＯ￣　

（　）

其中，第１个比值表示Ｗ　属于主题　的比例；第２个比值表　

示文档ｄ中被赋予主题　的单词所占的比例；Ｔ和　分别表　

示主题数和不同单词的总数；ｄ是位置ｉ所在的文档；ｎ　表　

示Ｗ分配给ｚ的次数；　表示所有单词分配给Ｚ的总次数；　

为文档ｄ中的单词分配给Ｚ的次数；ｎ　，是ｄ包含的单词总　

数。经过多次采样迭代后，就能得到每个单词的主题分配情　

况，同时也就知道了各个文档中每个主题出现的次数。然　

后，就可以得出ＬＤＡ模型中的概率分布。　

，

＋疗　

ｚ＂ｒ　（　）　

，

ｗ　

【ｂ）　

其中，　。就是文档　在主题空间模型中，主题Ｚ对应维度　

上的权重。　

３．２软件缺陷分派　

基于ＬＤＡ主题模型的缺陷分派方法利用ＬＤＡ模型来发　

现当中隐含的主题信息，通过对缺陷报告建立ＬＤＡ模型，　

将每个缺陷报告映射为主题空间里面的一个向量，然后在使　

用基于向量的分类器来对新的缺陷报告进行分派。图２显示　

了该方法的框架结构，从缺陷跟踪系统中得到缺陷报告后，　

先提取修复者和缺陷描述部分的信息，然后采用与２．２　中　

相同的方式进行预处理，再在上面构建ＬＤＡ模型，得到缺　

陷报告在主题空间上的向量表示。　

图２基于ＬＤＡ模型的缺陷分派框架结构　

对于一个新的缺陷报告　，同样使用Ｇｉｂｂｓ采样的迭代　

方法来估计其在主题上的分布。因为训练集中的单词的主题　

已经稳定，所以迭代时，只需要考虑新文档　里面的单词。　

但是在计算条件概率以更新状态的时候，需要将训练集和新　

文档中合并起来考虑。　

ｐ（ｚ　ｌ

ｉ　

　ｗ）

一　

　：　兰　

　’

塑二　±　

｝　

｛７）

其中，亓　和矗　分别表示全部集合（训练集＋新文档）中，单词　

４８　计算机工程　２０１１年１１月５日　

ｗ分配给主题ｚ的次数和所有单词分配给主题ｚ的总次数。　

然后，利用公式：　

…　：　

ｔ～１　＋Ｋ　

（８）　

就可以计算出　在主题空间上的向量表示了。　

４实验及结果分析　

实验选取了Ｅｃｌｉｐｓｅ的缺陷跟踪系统中编号ｌ～４　０００的缺　

陷报告作为样本，除去没有解决的和开发者出现次数小于　

ｌ０的部分，剩下２　７４６个样本，开发者数为４４，单词向量总　

维度为５　８２８。使用Ｇｉｂｂｓ采样获取ＬＤＡ模型参数时，　

５０／Ｔ，ｆｌ＝２００／Ｖ，Ｔ和　分别表示主题数和词表长度，迭代次　

数为３００。原始方法用单词的ＤＦ值来选择特征，因为前面去　

除停用词时已经去掉了ＤＦ最高的那些词，所以这里去掉ＤＦ　

值较小而保留ＤＦ最大的ｋ维特征，来和相同维度（３０，５０，８０，　

ｌ（）（】，１５０，２００，３００，４００，５０Ｏ）上基于ＬＤＡ的方法作对比。分　

类方法采用支持向量机（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ，ＳＶＭ）和Ｋ一　

最近邻（Ｋ—Ｎｅａｒｅｓｔ　Ｎｅｉｇｈｂｏｒ，ＫＮＮ），取　为５，１０，２０，３０，４０，　

５０，６０，７Ｏ时准确率的最优值。在测试时，采用１０一ｆｏｌｄｅｒ交叉　

・

验证，即将数据分成１０份，每次取９份做训练集，剩下的为　

测试集，取平均准确率作为衡量结果的标准，定义为：　

准确率＝　

因为ＴＦ－ＩＤＦ方法在数据达到在５００维时，使用ＳＶＭ　

分类器得到的分类效果仍处于上升趋势，继续测试７００维、　

１　０００维和ｌ　５００维的情况，得到的准确率分别为３７．５４％、　

３７．２９％和３６．７８％。到１　５００维时，剔除掉的单词最大ＤＦ为　

１０，不足样本数的０．５％，而且准确率也已经开始有所降低，　

因此，ＴＦ—ＩＤＦ在ＳＶＭ上的最高准确率为３７．５４％。２种方法　

在不同维度上的准确率对比如图３、图４所示。　

实验结果表明，ＬＤＡ的效果明显好于ＴＦ—ＩＤＦ的原始方　

法。在使用ＳＶＭ分类时，ＴＦ．ＩＤＦ在７００维上达到最好效果　

３７．５４％，ＬＤＡ在１５０维时的准确率则为３９．４５％。在低维度　

上，ＬＤＡ的优势更明显，维度同样为５０时，ＬＤＡ就能够得　

到３８．０７％的准确率，比ＴＦ—ＩＤＦ高出１３．８９％。在使用ＫＮＮ　

分类时，相比于原始的ＴＦ—ＩＤＦ，ＬＤＡ方法的准确率在各个　

维度上也都有所提高。　

图３　ＳＶＭ缺陷分派准确率比较　

图４　ＫＮＮ缺陷分派准确率比较　

使用ＬＤＡ将ｂｕｇ的描述映射到主题空间后，能够将同一　

主题下的相关词聚集到同一个维度上，这样在原来的空问上　

没有体现出来的相关性就得到了利用，从而克服了缺陷报告　

里描述文本较短、构成的向量空间过于稀疏、不利于衡量距　

离的缺点。观察图３和图４中的曲线可以发现，当使用ＬＤＡ　

时，分派效果随着维度的增加先升后降，这是因为选择的主　

题太少会导致区分性不够，而主题太多以后，一些单词之间　

的相似关系没有得到充分利用。　

５结束语　

本文提出了一种基于ＬＤＡ主题模型的软件缺陷分派方　

法，将问题从原始的单词空间转换到主题空间上解决。实验　

结果证明，该方法能够在降低维度的同时，提高缺陷分派的　

准确率。在软件缺陷分派问题中，缺陷跟踪系统中的历史数　

据隐含了开发人员相互合作的复杂网络。在今后的工作中，　

将利用这些信息，结合复杂网络中的社区挖掘算法，将软件　

缺陷分派给相关的小组，从较粗的粒度上缩小选择范围，再　

在小组内进一步通过自动或人工的方式对软件缺陷进行分　

派，从而从整体上提高软件缺陷分派的效果。　

参考文献　

ｆｌＩ】Ｃｕｂｒａｎｉｃ　Ｄ，Ｍｕｒｐｈｙ　Ｇ　Ｃ．Ａｕｔｏｍａｔｉｃ　Ｂｕｇ　Ｔｒｉａｇｅ　Ｕｓｉｎｇ　Ｔｅｘｔ　

Ｃａｔｅｇｏｒｉｚａｔｉｏｎ［Ｃ］／／Ｐｒｏｃ．ｏｆ　ｔｈｅ　１６ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　

Ｓｏｆｔｗａｒｅ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｋｎｏｗｌｅｄｇｅ　Ｅｎｇｉｎｅｅｒｉｎｇ．Ｅｄｉｎｂｕｒｇｈ，　

ＵＫ：【Ｓ．ｎ．］，２００４．　

【２］Ａｎｖｉｋ　Ｊ，Ｈｉｅｗ　Ｌ，Ｍｕｒｐｈｙ　Ｇ　Ｃ．Ｗｈｏ　Ｓｈｏｕｌｄ　Ｆｉｘ　Ｔｈｉｓ　Ｂｕｇ？［Ｃ］／／　

Ｐｒｏｃ．ｏｆ　ｔｈｅ　２８ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆ．ｏｎ　Ｓｏｆｔｗａｒｅ　Ｅｎｇｉｎｅｅｒｉｎｇ．　

Ｓｈａｎｇｈａｉ，Ｃｈｉｎａ：［Ｓ．ｎ．】，２００６．　

【３］Ａｈｓａｎ　Ｓ　Ｎ，Ｆｅｒｚｕｎｄ　Ｊ，Ｗｏｔａｗａ　Ｅ　Ａｕｔｏｍａｔｉｃ　Ｓｏｆｔｗａｒｅ　Ｂｕｇ　Ｔｒｉａｇｅ　

Ｓｙｓｔｅｍ（ＢＴＳ）Ｂａｓｅｄ　ｏｎ　Ｌａｔｅｎｔ　Ｓｅｍａｎｔｉｃ　Ｉｎｄｅｘｉｎｇ　ａｎｄ　Ｓｕｐｐｏｒｔ　

Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ［Ｃ］ＨＰｒｏｃ．ｏｆ　ｔｈｅ　４ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　

Ｓｏｆｔｗａｒｅ　Ｅｎｇｉｎｅｅｒｉｎｇ　Ａｄｖａｎｃｅｓ．Ｐｏｒｔｏ，Ｐｏｒｔｕｇａｌ：［Ｓ．ｎ．］，２００９．　

［４１　Ｂｌｅｉ　Ｄ　Ｍ，Ｎｇ　Ａ　Ｊｏｒｄａｎ　Ｍ　Ｉ．Ｌａｔｅｎｔ　Ｄｉｒｉｃｈｌｅｔ　Ａｌｌｏｃａｔｉｏｎ［Ｊ］．　

Ｊｏｕｒｎａｌ　ｏｆＭａｃｈｉｎｅ　Ｌｅａｒｎｉｎｇ　Ｒｅｓｅａｒｃｈ，２００３，３：９９３—１０２２．　

【５１石　晶，李万龙．基于ＬＤＡ模型的主题词抽取方法［Ｊｌｌ计算机　

工程，２０１０，３６（１９）：８ｌ＿８３．　

【６］Ｇｉｆｆｉｔｈｓ　Ｔ　Ｌ，Ｓｔｅｙｖｅｒｓ　Ｍ．Ｆｉｎｄｉｎｇ　Ｓｃｉｅｎｔｉｉｆｃ　Ｔｏｐｉｃｓ［Ｊ］．Ｐｒｏｃ．ｏｆ　

Ｎａｔｉｏｎａｌ　Ａｃａｄｅｍｙ　ｏｆ　Ｓｃｉｅｎｃｅ，２００４，１０１（Ｓ１）：５２２８—５２３５．　

编辑顾姣健　

发布者：admin，转转请注明出处：http://www.yc00.com/xitong/1715771965a2669309.html

缺陷分派主题单词空间

admin

网站建设
CPU与线程绑定
CPU与线程绑定
admin
9月前
690
建站资讯
免费AE模板大放送妈妈再也不用担心我的后期了
免费AE模板大放送妈妈再也不用担心我的后期了
admin
6月前
140
网站建设
这才是最靠谱的C盘清理！真正为打工人清理干净C盘彻底释放C盘空间！
这才是最靠谱的C盘清理！真正为打工人清理干净C盘彻底释放C盘空间！现在电脑用得比较多的人就是上班一族了，还有就是打游戏看电影的人群，其他人基本都用手机
admin
3月前
60
网站建设
聚焦ChatGPT4：开启中文及多语言主题新篇章！
博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能！ 专栏链接： 🔗 精选专栏： 《面试题大全》 — 面试
admin
3月前
100
网站建设
windows重装操作系统后oracle11g 数据库恢复（前提oracle安装目录还在表空间还在）利用原有oracle表空间文件还原数据库
昨晚上服务器重装C盘系统，并没有对数据库进行导出备份导致只有Oracle安装在E盘和表空间，这是对于没有经验的人来说特别苦恼，后来查找到了资料，试了一下
admin
3月前
170
网站建设
Navidrome音乐服务器 + 音流APP = 释放你的手机空间
20240727~20241015 By wdhuag 目录前言： 参考： Navidrome音乐服务器 Demo试用： 支持多平台：
admin
3月前
60
网站建设
kali kda安装 linux_搭建 WSL2 下的 Kali 环境（含GUI及空间优化）
Windows开启了WSL2的支持后，便被追捧为最佳Linux发行版。其实际性能究竟如何，我们可以通过 Kali Linux 进行一下体验。话不多说，下面开始配置。安装 WSL2 开启虚拟机功能在控制面板 -> 程序和功能 -&g
admin
3月前
50
网站建设
C盘空间越来越小偷偷的被蚕食一招恢复C盘大空间
C盘空间越来越小偷偷的被蚕食一招恢复C盘大空间。许多人都有这样的经历，电脑用着用着，某天忽然发现，C盘空间不足了。忽然就懵逼了，根本不知道怎么回事&
admin
3月前
80
网站建设
Win10笔记本C盘清理全攻略：释放空间，提速系统
Win10笔记本C盘清理全攻略：释放空间，提速系统在使用Windows 10操作系统的笔记本电脑过程中，很多用户都会遇到一个问题：系统盘（通常是C盘）空间逐渐减少，直至爆满。这不仅影响了系统的运行速度，还可能导致软件无法安装、系统更新失
admin
3月前
80
网站建设
系统盘标红后，没有空间最佳解决方案
系统盘没有空间，程序都运行下去了。试用了以下几种工具评测一次最好用的 CCleaner 优点国外软件，免费缺点不能彻底清除垃圾，只能清除一小部分金山毒霸&am
admin
3月前
110
网站建设
（亲试有效）u盘制作启动盘后空间容量变小解决方法
 问题：大家有可能使用U盘来制作启动盘的需要，但是使用过来发现U盘的空间容量变小了，1G2G4G8G16G等变成了几百
admin
3月前
60
网站建设
如何将必应（Bing）的背景图片设定成 Windows 7 的主题
今早在网络遨游寻找有没有什么新鲜事儿分享时，发现了一篇 "How to Set A Bing Wallpaper Desktop Slideshow In Windows 7"。试用后&#x
admin
3月前
260
网站建设
U盘显示空间小于实际U盘空间的解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。
admin
1月前
40
网站建设
电脑C盘满了变成红色了怎么清理？3招，轻松解决C盘空间问题
对于电脑，我们国家已经普及非常广泛了，几乎每一个家庭都至少有一台电脑。虽然电脑普及很广，也很多年了，但是我们国民的电脑水平依旧非常一般&#xff
admin
1月前
20
网站建设
c盘怎么扩容 5种方法快速解决c盘空间不足
C盘是操作系统主要安装和存储系统文件的位置，也是系统盘，对电脑的运行是非常重要的，而c盘扩容操作涉及到系统文件和程序，需要格外小心。下面给大家介绍几个简
admin
1月前
40
网站建设
如何将其他盘的空闲空间转移给C盘（C盘的扩容）
文章目录如何将其他盘的空闲空间转移给C盘（C盘的扩容）前言：具体操作： 如何将其他盘的空闲空间转移给C盘（C盘的扩容&#
admin
1月前
640
网站建设
Win7 AERO主题变成灰色解决方法
今天郁闷了半天，win7 系统 AERO主题变成了灰色，任务栏失去了透明度，安装新主题也提示，该主题。去网上搜寻了很多方法来解决.都不可以。最终发现wi
admin
1月前
120
网站建设
Armbain系统根分区空间不足处理
Armbain系统根分区空间不足处理一、系统检查1.查看debain版本2.查看CPU信息二、检查磁盘情况三、分析各级目录占用空间1.总体查看根分区下目录大小2.对根分区下目录按占用空间大小排序四、清理不重要的占用空间最大目录及文件五
admin
1月前
20
网站建设
Windows 7 的100M保留空间
在安装Windows 7时如果是安装的分区是在Windows 7安装时创建的，会导致操作系统预留100M或者200M的一个预留分区。这个分区是为了Windows 7的BitLocker用的。 BitLocker是
admin
1月前
30
网站建设
U盘不显示文件但有占用空间：问题解析与高效恢复方案
在日常的数字生活中，U盘作为一种便携式的存储设备，因其小巧便携、容量大、传输速度快等特点，被广泛应用于数据备份、传输和分享。然而，有时候我们可能会遇到这
admin
26天前
20

发表回复

评论列表（0条）

暂无评论

基于LDA主题模型的软件缺陷分派方法

发表回复

评论列表（0条）

联系我们

400-800-8888

基于LDA主题模型的软件缺陷分派方法

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888