基于CRITIC加权赋值的汉语句子难度测定

基于CRITIC加权赋值的汉语句子难度测定


2024年4月30日发(作者:)

皇 皇 壁 

基于CRITIC加权赋值的汉语句子难度测定 

。郭望皓 

(解放军外国语学院外训系,江苏昆山215300) 

【摘 要】论文利用汉语字、词难度,推算句子难度,考察了句子难度与字、词难度之间的数量关系,一方 

面选取最为合适的维度考察字、词在句子难度测定时的作用;另一方面计算字、词难度与句子难度的量化关 

系。通过CRITIC加权赋值,得出8组句子难度的测定公式。检验结果显示,由8个公式计算得出的汉字、词 

汇的难度值与句子难度之间均存在显著的正相关关系,与加权之前相比,相关性均有增加。 

【关键词】CRITIC加权赋值;句子难度;测定 

中图分类号:H 146.3 

文献标识码:A 文章编号:1672—8610(2016)12—0010—03 

(一)语料选取与处理 

研究目的及意义 

句子作为一个能够表达相对完整意思的语言单位,是一个无限 

1.语料选取。我们选取了《博雅汉语》系列教材中的28篇课文作 

为实验的基本语料。《博雅汉语》系列教材共九册121篇课文,按照上 

文的分级,将九册教材分为初、中、高三个级别,初、中、高三级的课文 

总量分别为55篇、38篇、28篇。在此基础上,考虑到难度分布的实际, 

按照不同的比例,等距离从这三个级别中分别选取10篇、9篇、9篇课 

文。其中初级每六课选取一篇,中级每四课选取一篇,高级每三课选 

取一篇。 

和开放的集合。相对而言,字、词则可看作有限而且封闭的集合。因 

此,可以用频率估测字、词的难度,但对句子难度难以进行直接测定。 

通过定量研究的方式根据字、词难度推算句子难度,也就是考察句子 

难度与字、词难度之间的数量关系,是本文研究目的所在。具体而言, 

本文有以下两个研究目的: 

1.选取最为合适的维度考察字、词在句子难度测定时的作用; 

2.计算字、词难度与句子难度的量化关系。 

句子难度测定是文章难度测定的基础,可为文本易读性公式的 

拟合,实现文本难度的自动测算,迅速有效进行文本难度分类,提供 

可靠支持。 

二、测定方法 

2.语料处理。先将选取的28篇课文录入计算机,共i ̄40722字。然 

后运用北京大学詹卫东博士提供I ̄TextPreProcessing程序对文本进 

行预处理,具体包括删除空格、文本断句和句子编号三个步骤。通过 

机器自动断句,辅之以人工校对,共得到1261个句子,其中初级课文 

中的句子数量为253个,中级为320+,高级为688个。最后采用分层随 

机抽样的方式,分别从这三个级别中选取30+句子考察句子与字、词 

难度的关系。随机数的生成采用Random.orgN站上的随机数生成程 

本文选用的计算方法为CRITIC(Criteria Importance Through Inter— 

cirteria Correlation) ̄1]权赋值法。CRITIC法是I ̄Diakoulaki提出的一种 

客观权重赋值方法m。它的基本思路是以两个基本概念为基础确定指 

标的客观权数。这两个基本概念:一是对比强度,它表示了同一个指标 

序,该程序利用大气噪音生成随机数,相对于计算机生成的伪随机数 

而言,属于真随机数生成器。根据生成的90+随机数,提取序号相同 

的90个句子作为我们实验的对象。它们所属的课文编号即是它们的 

难度。 

各个评价方案之间取值差距的大小,以标准差8 j的形式来表现,即标 

准差的大小表明了在同一个指标内各方案取值差距的大小,标准差越 

大各方案之间取值差距越大。二是评价指标之间的冲突性,指标之间 

的冲突l生以指标之间的相关性为基础,如两个指标之间具有较强的正 

相关,说明两个指标冲突性较低。第j个指标与其他指标的冲突性的量 

接下来对90+句子进行切词及词性标注。切词、标注采用的是先 

机器自动切分标注,然后进行人工校对。校对的总标准以《汉语水平 

词汇与汉字等级大纲(修订本)》日词汇等级大纲为准,即大纲中作为 

化指标为∑O一 ),其中rkj是评价指标k和i之间的相关系数。各个指 

标的客观权重就是以对比强度和冲突性综合衡量的。诳j表示第j个评 

个词语的,实验材料中也划为一个词语。由于《大纲》中仅收录了 

价指标包含的信息量,则Ej可表示为:(1)EJ=s 。一 )( 二 ) 

Ej越大,第j个评价指标包含的信息量越大,该指标的相对重要性也 

法既考虑了指标变异大小对权重的影响,又考虑了各指标问的冲突 

8822个词语,所以在校对过程中又同时参考山西大学计算机与信息 

技术学院的{973当代汉语文本语料库分词、词性标注加工规范(草 

规范》 和北京大学计算语言学研究所的《北京大学现代汉语语料库 

基本加工规范 。 

在对词语校对的同时,对词语的难度进行标注。难度标注以《汉 

语水平词汇与汉字等级大纲》为标准。未收录在大纲中的词语一律标 

注为超纲词。 

(二)变量选取与处理 

》嘲,也参照中华人民共和国国家标准《信息处理用现代汉语分词 

就越大,所以第j个指标的客观权重wj应为:(2) 一 f : ,s1该 

案)

性。当标准差一定时,指标间的冲突性越小,权重越小;冲突性越大, 

权重也越大。由于这种方法不需人工干预、计算量不大等优点,故广 

泛应用于金融、医疗、农业等多种学科。 

三、实验步骤 

实验包括语料选取与处理、变量选取与处理、权重计算三个部分。 

lO [作者简介】郭望皓,解放军外国语学院外训系讲师,文学硕士,研究方向:计算语言学及对外汉语教学。 

语l塞  

对90+句子的变量进行统计。统计的变量包括字次数、比例,字 

种数、比例,词次数、比例及词种数、比例在内的4大类8小组共计40个 

变量。具体变量名称见表1。 

表1变量总表 

字次token 字乖 ’type 词次token 词种蛳pc 

甲级 甲级字 甲级 甲级字 珲I级词 甲级词 甲级词 甲级词 

字数餐 比例 字数量 比例 数量 比例 数量 比例 

乙级 乙级字 乙级 乙级字 己级词 乙级词 乙级词 乙级词 

字数量 比例 字数量 比例 数量 比例 数量 比例 

丙级 丙级字 丙级 丙级字 丙级词 丙级词 丙级词 _闶级澜 

字数量 比例 字数量 比例 数量 比例 数量 比例 

丁级 丁级字 T 级 J‘级字 l‘级词 T‘级词 丁‘级词 丁级阐 

字数量 比例 字数鼙 比例 数量 比例 数量 比例 

超纲 超纲字 超纲 超纲字 超纲词 越纲词 超纲词 超纲词 

字数量 比例 字数量 比例 数最 比例 数摄 比例 

下一步要对选取的4o+变量进行量化处理,具体方法是: 

字层面上:首先使用Microsotf Ofifce Access 2007软件,计算每个 

句子包含的非重复字数(不含标点符号、人名及地名,但包括其他专 

有名词),即重复出现的字只按一个计算,以消除各段汉字复现率不 

同带来的差异,计算非重复字数时不包括人名、地名用字。根据《汉语 

水平词汇与汉字等级大纲(修订本)》中的汉字等级大纲,利用Visual 

Studio 2012进行编程,计算四个等级的汉字的字次数、字种数及其各 

自比例。 

词层面:根据切词的结果,同样使用VisualStudio2012编程,根据 

《汉语水平词汇与汉字等级大纲(修订本)》中的词汇等级大纲,分别 

计算不包括人名、地名的四个等级的词次数、词种数及其各自比例。 

(三)权重计算 

根据上文选取的变量,我们一共统计了3600个数据(90× 

40=3600),称之为原始数据。将这3600个原始数据按照各级别字次 

数量(以下简称字次数),各级别字种数量(以下简称字种数),各级别 

占字次比例(以下简称字次比),各级别占字种比例(以下简称字种 

比),各级别词次数量(以下简称词次数),各级别词种数量(以下简称 

词种数),各级别占词次比例(以下简称词次比),各级别占词种比例 

(以下简称词种比),分成八组,每组分别进行数据标准化处理并用 

CRITIC法计算各级别在本组中所占权重。具体方法如下所示。 

1.数据标准化。数据标准化处理主要包括数据同趋化处理和无 

量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题, 

由于对不同性质指标直接加和不能正确反映不同作用力的综合结 

果,所以须首先考虑改变逆指标数据性质,使所有指标对测评方案的 

作用力同趋化,再加和才能得出正确结果。在本实验中,考察甲级字、 

词的比例时,由于其数值与难度成负相关,要将该数据趋同化处理。 

数据无量纲化处理主要解决数据的可比性,在此采用指数化处理方 

法。指数化处理以指标的最大值和最小值的差距进行数学计算,把数 

据映射到区间[0—1]之上。具体公式如下: 

d, : :竺 

m=L—m 

! L f

LJ=1,

 l2…92

2,

I3

3,4,5 

01 

(4)aq= 

其中,i表示句子编号,i表示各组中的级别(从1到5分别表示甲级 

到超纲) 表示第i个/fJ- ̄j个级别的数据。在将甲级字次比、甲级 

字种比、甲级词次比、甲级词种比四组数据标准化时,采用公式(4); 

其他数据标准化采用公式(3)。 

根据标准化后的数据,还可以得到标准化后数据的比例 

p 。 的计算公式为: 

㈥PtJ= : 

堕 

2.CRITIC加权赋值法 

下面给/ ̄CRITIC法求权重的具体算法: 

步骤1:将原始数据iij标准化为dij(公式3或4); 

步骤2:根据标准化数据d 求其所占比例pij(公式5); 

步骤3:根据pij计算5个级别之间的相关系数rkj(sPss计算相关 

系数); 

步骤4:对1减相关系数rkj进行加和运算,公式为: 一r ̄、 kn=5 ); 

步骤5:求标准化数据 的标准差8j(sFss计算相关系数); 

步骤6:计算第j个级别包含的信息量Ej(公式1),即步骤4与步骤 

5所得结果之积; 

步骤7:求得最后的权重系数wi(公式2)。 

四、结果分析 

本部分根据CRITIC法求出的每个级别的难度系数值 ,求出每 

个句子的字、词难度,并将该字、词难度与句子难度进行相关分析,以 

探求如下两个问题: 

(1)运用CRITIC法计算出来的各级别权重系数是否合理; 

(2)对分别计算的8组变量进行比较,看究竟哪几组变量与句子 

难度相关性更高。 

(一)句子难度与变量的相关性分析 

在上文中,我们将40+变量分为四大类八小组,这四大类分别是 

字次、字种、词次及词种。表2给出了各变量与句子难度的相关系数。 

表2句子难度与字次、字种、词次、词种各级别变量相关系数表 

相关性在0.O1水平上显著(双尾). 

相关性在0.05水平上显著(双尾). 

从表2中我们不难看出句子难度与其qh33个变量在0.O1显著水平 

上呈相关,其中与甲级字比例有关的四个因素呈负相关;与1个变量 

(甲级词词次数量)在0.05显著水平上呈正相关;与6个因素不相关,这6 

个不相关的因素分别是丁级字字次数量、丙级字字次比例、丁级字字 

次比例、超纲字字次比例、超纲字字种比例和甲级词词种数量。 

在这四十个变量中与句子难度相关性最高的变量是甲级词的词 

次比例,呈显著的负相关关系,相关系数的绝对值达到了0.759。在八 

个小组中,字种数、词次数、词次比和词种比四组变量中所有的子变 

量与句子难度呈显著相关。 

(_ ̄)CRITIC法赋值结果分析 

我们对360o+数据进行了分组演算,得到各分变量的权重系数 

矩阵。 

表3各分变量权重系数矩阵表 

甲(A) Z 雨(C) 丁(D) 趣纲(E) 

字次数(1) 0 140 O2l5 O.171 O 2Ol 0.273 

字种数(2) 0.148 O 182 O l37 O215 0273 

字次比(3) O.136 0.252 0.294 O.184 O.134 

字种比(4) O.158 O.28l 0.229 O.169 O.16l 

词次数(5) O.157 0.2o6 O.163 O l67 0 307 

词种数(6) 0.210 0.165 0.151 0.205 0.269 

词次比(7) 0 l32 O 185 0249 0.246 0 l88 

词种比(8) O.133 0.203 O 2O7 0242 0.215 

设甲、乙、丙、丁、超纲五个级别的数量或比例分别为A、B、c、D、 

l E 

语言文字修辞 

E,y为句子中字或词的难度。y与A、B、C、D、E成线性相关关系,则 

6)y=8LA+I32B+p3C+口4D十psE 

将表3的权重系数矩阵中的数据分别代入公式6,得到以下8个公 

式,分别代表以字次数、字种数、字次比、字种比求得的汉字难度,及 

由词次数、词种数、词次比、词种比求得的词汇难度。 

(6-1)y=0.140 A+0.215 B+0.171 C+0.201 D+0.273 E 

(6-2)y=0.148 A+O.182 B+0.137 C+O.215 D+O.283 E 

(6-3)r=0.136"A+0.252'B+0.294"C+0.184"D+0.134"E 

(6-4) =0.158 A+0.281 B+0.229 C+0.169 D+0.161 E 

(6-5) ,=0.157"A+0.206 B+0.163"C+0.167 D+O.307 E 

(6-6) ,=0.210 A+0.165 B+0.151"C+0.205 D+O.269 E 

(6-7) ,=0.132 A+0.185 B+0.249 C+O.246 D+0.188 E 

(6-8)y-0.133 A+O.203 B+0.207"C+0.242 D+0.215 E 

将变量选取之后统计而得的3600 ̄原始数据,分别代人以上八 

个方程,得到90个句子汉字、词汇的各四组难度值。再把该难度值与 

句子难度进行Pearson相关分析,具体结果如下。 

1.汉字难度与句子难度相关性检验。经过加权计算得出的汉字 

难度与句子难度的相关系数见表4。 

表4汉字难度与句子难度相关性检验表 

句子难度 宇次数 宇种数 字次比 宇种比 

级别 (加权值) (加权值) (加权值) (加权值) 

PearsOn Colrelafion 1 O.863“ O.665_l O 53g 0.430" 

句子难 

度级荆 sIg(2 ̄ailed) 0.00o 0.000 0Oo0 0.0D2 

N 。0 90 go gO gO 

Pear=on Conelation O ∞3“ 1 0.077“ O.29 0 224t 

(加权值)

字次数 

 Sig(2-tailed) 0.000 0 000 00O5 0.033 

N gO gO 90 gO 90 

Peanmn Comdation 0.665¨ 0.07r ’ O.2 0.220‘ 

字种数 

加权值) Sig.(2-tailed) 0.000 0∞O O0o6 0.037 

N 90 gO go 90 gO 

Pearson Con ̄ation 0 539‘‘ 0.285 O292-‘ 1 0.371‘’ 

(加权值)

字次比 

 Sig(2-tailed) O0o0 00o5 Ooo6 0.00o 

N go go 90 gO gO 

Pear ̄on Con'elation 0柏0“ 0.22 0224t O.371” 1 

(加权值)

字种比 

 Sig.《2-tailed) O.002 0 033 O 037 0000 

N 90 go 90 90 90 

相关性在0.O1水平上显著(双尾)。 

相关性在0.05水平上显著(双尾)。 

从表中我们可以得到以下事实: 

(1)经过加权的字次数、字种数、字次比和字种比与句子难度都 

呈显著的正相关关系。相关系数最高的是字种数,相关系数最低的是 

字种比。 

(2)加权之后的字次数与字种数之间的相关性极高,达到了 

0.977。 

(3)从整体来看,加权后在汉字这一层面,字次数和字种数与句 

子难度的相关性更高。 

根据表4与表2的比较,可得出以下结论: 

加权后的汉字难度与句子难度相关性高于加权之前。加权之后 

相关性最高的是字种数,相关系数为0.665,最低的是字种比,相关系 

数为0.430,并且所有数值在0.01水平上呈显著性正相关。而加权之前 

与句子难度相关性最高的是乙级字字次数量,相关系数为0.583,相 

关度最低的是超纲字字种比例,相关系数仅为0.022,在20个数据中 

有5个相关性不显著。因此,可以认为加权后得到的汉字难度值与句 

子难度的相关性较加权之前有较大幅度的提高,加权不仅实现了降 

维的目的,而且较加权前的数据更具合理性。 

由于句中总字次数一般作为句长的测量标准,句长也是句子难 

三 度的重要指标,为避免线性回归中的共线问题,在这里选用加权后的 

语l文l 

 f

字种数作为汉字的难度。即句中汉字难度的测量值为: 

(6-2)Y =O.148"A+0.182"B+0.137"C+0.215'D+0.283*E 

(A、B、c、D、E分别为句中甲、乙、丙、丁、超纲字的字种数) 

我们选用的这一自变量与王蕾易读性公式中选用不重复字作为 

自变量实为同一种变量[61。不重复字数即是字种数,二者正好可以相 

互印证,反映出汉字字种数确实在测量句子、文本的难度中有着不可 

忽视的重要作用。 

2.词汇难度与句子难度的相关陛分析。与上文中汉字难度的计算 

过程相同,通过(6~5)至(6—8)四个公式的计算,得到加权后的词汇 

难度值,从而实现将5个级别的词汇难度数值或比例用一个统一值表 

示,为下面易读性公式拟合时减少了自变量的数量,从而为提高公式 

的可靠性奠定基础。加权之后词汇难度与句子难度的相关性见表5。 

表5词汇难度与句子难度相关性检验表 

句子赡度 词次数 词种戴 词次比 词种比 

级别 (加权值) (加投值) (加权值) (加权健) 

皮尔逊相关 1 0.556 O5o7。 O.76r 0.533 

句子难度 

级别 显薯值8l口.(双尾) O.Ooo O∞O 0-0O0 O∞ 

数量 90 90 90 90 90 

皮尔避相关 O55 1 O.97曰 O.432 O.3∞’ 

词次数 

加权值) 显著值s (取尾) O.∞0 0O0o O.00o O.∞O 

数量 gO gO 90 gO 90 

皮尔避相关 05a7 0978“ 1 0371 0 363“ 

(加权值)

词种数 

 显著值SIg.(双尾) 0 000 0.000 0.000 O.O∞ 

数量 90 90 90 90 90 

皮尔逊相关 0.767 0.432.. 0.371 1 O.646“ 

(加权值-

诃谈比 

 显著值sjg(双尾) 0.0oO 0000 0.000 0.000 

数量 gO go gO gO gO 

皮尔避相关 0533 0368 0363 0646 1 

(加权值)

词种比 

 显著值sIg.(双尾) O.O0o O000 0.O∞ O.000 

数量 90 90 90 90 90 

相关性在0.O1水平上显著(双尾)。 

从表中可看出,加权后的词次比与句子难度级别的相关系数达 

到了0.767,其余三项与句子难度的相关系数处于0.5 0.6之间,全部 

四项相关系数均在0.01水平上呈显著正相关。 

与加权之前的表2进行比较,在表2中相关系数最高的指标是甲 

级词词次比例,相关性的绝对值为0.759,低于加权之后最高值0.767, 

但高于其他三项指标的相关系数。即若采用加权后的词次数、词种数 

和词种比的任何一种作为词汇难度的测量标准,都不如直接采用甲 

级词词次比例作为标准的准确性高,因此,只能采用加权后的词次比 

作为词汇难度的测量标准。即词汇难度的测定公式为: 

(6-7)y。=0.132'A+0.185"B+0.249"C+0.246"D+0.188"E 

(A、B、C、D、E分别为句中甲、乙、丙、丁、超纲字的词次比) 

五、结论 

本文我们对句子难度和汉字、词汇难度之间关系进行了量化分 

析。通过CRITIC法对每个难度级别的字、词变量进行加权处理,得出 

八个测量汉字、词汇难度的公式,并对其进行相关系数的检验。检验 

结果显示,由8个公式计算得出的汉字、词汇的难度值与句子难度之 

间均存在显著的正相关关系。与加权之前相比,相关性均有增加。其 

中效果最好的两组公式分别以字种数测量汉字难度的公式(6—2)和 

以词次比测量词汇难度的公式(6 5 o这两个公式,均以《汉语水平 

词汇与汉字等级大纲(修订本)》为难度划分的标准,以句中字、词难 

度分布为自变量,考虑到每一个字、词的作用,因而依靠其作为句子 

难度的测定公式,灵敏度要更高。另外,这两个公式测定的汉字与词 

汇的难度均可作为自变量进人文本易读性公式的拟合,从而实现了 

对自变量数目的控制,为公式的拟合优度提供前提和保障。 

(下转2O页) 

皇 ! 壁 

(3)The British people have made a choice.That not only needs 

to be respected but those on the losing side of the argument,myself in— 

cluded,should help to make it work. 

tries and European citizens living here that there will be no immediate 

changes in your circumstances.There will be no initil change ian the 

way our people can travel,in the way our goods Can move or the way 

our services call be sold. 

在这个句子中使用not only…but…进行让步,指出英国人民 

的脱欧选择不仅应得到尊重,而且反对脱欧的一方还应协助脱 

欧工作的实施。在这句语中,命题一尊重选择不是重点,命题二 

辩论中失败方应协助脱欧工作成为卡梅伦强调的重点。 

(4)This is not a decision I have taken lightly.but I do believe it 

is in the national interest to have a period of stability and then he new t

这两句表达则重复使用了中值情态动词will和低值情态动 

词Call,表达卡梅伦对于英国未来的展望。第一句用would这种意 

愿情态动词降低断言reassure的肯定性,表明卡梅伦认为退欧暂 

时不会对于居住在欧盟各国的英国人以及居住在英国的欧盟公 

民产生影响。will描述的未来是基于语言使用者自身的展望而不 

是事实,因此开放了对话的空间。同时,will也是卡梅伦对于未来 

的一种承诺,用以使民众继续支持这届政府。“Cn”这种模糊介 a

入标记一方面可以委婉地表明语言使用者自己的判断,一方面 

也降低了语言使用者对于自己判断的肯定程度。低值情态动词 

具备高度协商陛,并引导读者/听者思考,影响其判断。 

四、结束语 

leadership required. 

这个句子表达了卡梅伦试图与英国脱欧撇清关系并力求全 

身而退的意愿。否认not,反对bu汲断言I do believe三种介入标记 

都是收缩性话语资源,基本上关闭了听众参与对话的空间,引导 

民众认同英国需要新领导人这一观点,为下文的辞职做好铺垫。 

(二)对话扩展资源 

对话扩展指语言使用者允许来自内部或外部其他对话声音 

出现。对话扩展强调多声的协商,扩大了对话空间。卡梅伦演讲 

中运用较多的是接纳性资源(entertain)。接纳性资源展现了作者 

通过以上分析我们可以看出,在表述退欧是民众的选择这 

观点时,卡梅伦较多使用对话紧缩型资源,表明退欧是民众选 

择及自己尊重这一选择,关闭讨论空间,不容他人质疑公投是民 

对人际对话“多声”的包容程度,因为“多声”能够影响读者对语 

篇产生不同的解读。演讲者如果运用接纳性资源,允许多声的协 

主的伟大胜利。在表述退欧可能的影响及辞职时,卡梅伦较多使 

用对话扩展资源,表明退欧的影响并非自己可以掌控,而且作为 

留欧派已经无法根据民众的意愿带领英国继续前行,辞职并非 

商,则表明演讲者“不仅能够提供还能够包容不同的观点和意 

见”。(姚俊,2010:30) 

(1)The British people have voted to leave the European Union 

and their will must be respected. 

本意而是不得已为之。此时我们可以看出卡梅伦辞职演讲传达 

的意义非常明确:一是巧妙地将民众的关注点转移到公投是民 

主的胜利这一现象上来,二是主动辞职从而减轻了作为留欧派 

的保守党执政不力被攻击的尴尬。 

【参考文献】 

[1]Martin,J.R.&P.R.White.The Language of Evaluation:AP— 

PRAISAL in English.London:Palgrave,2005. 

(2)The will of he Brtitish people is all instruction that must be 

delivered. 

(3)We must now prepare for a negotiation with the European U— 

nion. 

这三个句子中使用了高值情态动词must,属于义务型情态 

动词,说服力是显而易见的。演讲中,作为留欧党成员的卡梅伦 

在概述了此次公投的结果后,使用must表明自己尊重这一结果。 

第二句中的must体现了民主体制下民众意愿的充分表达,强调 

了退欧是民众的意愿。第三句则是提及这次公投会带来的改变, 

表明退欧不仅仅是单方面的公投就完成了,还需要与欧盟协商 

[2]胡壮麟,朱永生,张德禄,李战子.系统功能语言学概论[H].北 

京大学出版社,2005. 

[3]穆从军.中英文报纸社论之元话语标记对比分析[J].外语教学 

理论与实践,2010(4). 

[4]王振华.评价系统及其运作:系统功能语言学的新发展[J].外 

国语,2001(6). 

系列后续问题,这是政府的义务。这种接纳性介入资源将持各 

种意见的听众作为潜在参与者,看似是单方面观点的强行输出, 

实质是将留欧派和中立派的声音都纳入对话。 

(4)And 1 would laso reassure Britons living in European COUn— 

(上接12页) 

[5]王振华,路洋.介入系统嬗变[J].外语学刊,2010(3). 

[6]姚俊.英语论文摘要的语篇模式与作者介入[J].外语教学, 

2010(4). 

[3]杨尔弘.973当代汉语文本语料库分词、词性标注加工规范(草 

案)[D].山西大学计算机与信息技术学院,2003. 

[4]GB/T13715—9.信息处理用现代汉语分词规范[S].1992 

【参考文献】 

[1]王昆,宋海洲.三种客观权重赋权法的比较分析[J].技术经济 

与管理研究,2003,24(6). 

[2]国家汉语水平考试委员会办公室考试中心.汉语水平词汇与 

汉字等级大纲(修订本)[S].经济科学出版社,2001. 

[5]俞士汶,段慧明.北京大学现代汉语语料库基本加工规范[J]. 

中文信息学报,2002,1 7(5). 

[6]王蕾.初中级日韩留学生文本可读性公式初探[D].北京语言大 

学硕士论文,2005. 


发布者:admin,转转请注明出处:http://www.yc00.com/news/1714464029a2451502.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信