logo
亲近母语

首页 > 首页资讯

亲近母语持续研究中文分级阅读,打造中文分级阅读产品体系

作者:  发表时间:2020-04-16 15:11:07

分级阅读在国外已经很成熟,有一整套英文分级阅读标准系统,不仅运行了将近40年且已覆盖了美国90%的学校,如Lexile分级(蓝思分级)、GE分级等。而在国内,中文阅读不仅连分级标准都未建立,很多教师甚至连分级阅读都没听过,教师、家长对孩子的阅读水平的了解也一直处于空白状态,因为获取这一数据的渠道不是没有,就是非常非常有限。

在欧美,英文的分级阅读主要有两个维度:

语义:主要看词频,如果一个单词出现的频次很低,则系统会判定这个词相对较难。

句法:主要看句子长度,长句一般较难去分析和理解。而句子难度跟从句、副词、介词等的使用也密切相关。

在这两个维度上,欧美国家通过统计学的方法来完成分级阅读标准的建立。中文分级阅读标准(ER Framework)借鉴了国外的“词、句”的分析思想,因而和其有一定的相似性。

中文和英文的三大本质区别主要在于:

基础单元:英文的基础是26个字母,中文的常用汉字达3500个,这就决定了中文阅读的分析必然需要一个规模化的语料库。

分词:英文不需要分词,仅需空格即可判定词语的边界,但汉字脱离不了分词。如「量子自旋效应」这个词,有人可以将其分为「量子」、「自旋」、「效应」三个词,也有人认为这就是一个词。但在英文中就无此类困扰。

句式结构:在句式结构上,英文要严谨得多,如主从句之间会有that、which、what等来界定。中文的行文风格则较为随意,嵌套结构也要混乱得多。

鉴于这三大区别,基于ER Framework的分级阅读标准从「字词句段篇」五大维度提取几十个特征来表达中文的难度,并实现段落、主题等的分析。如在「字」其下还有常用性、构形、组合性三个特征,「句」则有句法结构、语义逻辑、修辞表达和嵌套深度四个特征等等。

“因为中文的的句子相较英文要复杂得多,机器在理解中文的第一步就会遇到词性分析、语言模型上的困难。所以,有赖于现在流行的AI技术,如RNN、LSTM等深度学习技术,可以弥补中文在NLP上的缺失。”

“现在我们可以做到,将一个句子按照句法树、依赖关联等予以拆解,以分析每一个成分在句子中的比重,从而实现阅读文本的难度分级。”

区别于欧美英文分级阅读,亲近母语的分级阅读系统最大的优势亲近母语研究院持续专注的研究。随着用户数量的增加,产生的数据越多,分级阅读系统中的模型可实现自主学习,不断优化,从而对文本阅读的难度感知越发准确。

  • 基于ER Framework的个性化分级阅读系统;
  • 基于ER Framework和“新课标”的阅读能力测评;
  • 针对公立学校的阅读整体解决方案,包括教师培训、整本书解决方案、分级短文材料,分级阅读测试等。

国内很多中小学都很重视学生的测评,但在阅读能力的测评上却处于相对空白的状态。亲近母语研究院在线上和线下:在国内的一线到四线城市,对近10万学生进行了基于ER Framework和“新课标”的阅读能力测试,并对相关数据进行分析,最终出具了一份中国学生的阅读能力量表。在测评的助攻下,亲近母语成功打通了和中小学合作的路径。

「教师」这一角色反而是整个推进过程的关键角色。因为虽然已经开发出中文分级阅读标准及其配套工具和产品,但这些工具和产品依然需要人来使用,需要教育者来向这些孩子传递教育的温度和理念。但是,国内教育理念跟不上,语文教师对整个前沿教育的趋势掌握不到位......这些都是问题。

分级阅读进入国内的这些年,不是没有遭受过质疑之声,有人认为分级阅读不适应中国国情,比如有些孩子从小耳濡目染四大名著,可能会对超出分级阅读系统推荐的书目以外的书籍感兴趣,当然不能排除这种可能性。

分级阅读系统只是一种工具,它并不能喧宾夺主说可以取代老师。做分级阅读的意义就在于,想告诉家长和老师,哪种文本难度的书目是适合你的孩子或学生去阅读的。至于读还是不读,依然需要家长和老师去做出判断。

当前文章标签: