亲近母语持续研究中文分级阅读，打造中文分级阅读产品体系

作者：　发表时间：2020-04-16 15:11:07

分级阅读在国外已经很成熟，有一整套英文分级阅读标准系统，不仅运行了将近40年且已覆盖了美国90%的学校，如Lexile分级（蓝思分级）、GE分级等。而在国内，中文阅读不仅连分级标准都未建立，很多教师甚至连分级阅读都没听过，教师、家长对孩子的阅读水平的了解也一直处于空白状态，因为获取这一数据的渠道不是没有，就是非常非常有限。

在欧美，英文的分级阅读主要有两个维度：

语义：主要看词频，如果一个单词出现的频次很低，则系统会判定这个词相对较难。

句法：主要看句子长度，长句一般较难去分析和理解。而句子难度跟从句、副词、介词等的使用也密切相关。

在这两个维度上，欧美国家通过统计学的方法来完成分级阅读标准的建立。中文分级阅读标准（ER Framework）借鉴了国外的“词、句”的分析思想，因而和其有一定的相似性。

中文和英文的三大本质区别主要在于：

基础单元：英文的基础是26个字母，中文的常用汉字达3500个，这就决定了中文阅读的分析必然需要一个规模化的语料库。

分词：英文不需要分词，仅需空格即可判定词语的边界，但汉字脱离不了分词。如「量子自旋效应」这个词，有人可以将其分为「量子」、「自旋」、「效应」三个词，也有人认为这就是一个词。但在英文中就无此类困扰。

句式结构：在句式结构上，英文要严谨得多，如主从句之间会有that、which、what等来界定。中文的行文风格则较为随意，嵌套结构也要混乱得多。

鉴于这三大区别，基于ER Framework的分级阅读标准从「字词句段篇」五大维度提取几十个特征来表达中文的难度，并实现段落、主题等的分析。如在「字」其下还有常用性、构形、组合性三个特征，「句」则有句法结构、语义逻辑、修辞表达和嵌套深度四个特征等等。

“因为中文的的句子相较英文要复杂得多，机器在理解中文的第一步就会遇到词性分析、语言模型上的困难。所以，有赖于现在流行的AI技术，如RNN、LSTM等深度学习技术，可以弥补中文在NLP上的缺失。”

“现在我们可以做到，将一个句子按照句法树、依赖关联等予以拆解，以分析每一个成分在句子中的比重，从而实现阅读文本的难度分级。”

区别于欧美英文分级阅读，亲近母语的分级阅读系统最大的优势亲近母语持续专注的研究。随着用户数量的增加，产生的数据越多，分级阅读系统中的模型可实现自主学习，不断优化，从而对文本阅读的难度感知越发准确。

基于ER Framework的个性化分级阅读系统；
基于ER Framework和“新课标”的阅读能力测评；
针对公立学校的阅读整体解决方案，包括教师培训、整本书解决方案、分级短文材料，分级阅读测试等。

国内很多中小学都很重视学生的测评，但在阅读能力的测评上却处于相对空白的状态。亲近母语在线上和线下：在国内的一线到四线城市，对近10万学生进行了基于ER Framework和“新课标”的阅读能力测试，并对相关数据进行分析，最终出具了一份中国学生的阅读能力量表。在测评的助攻下，亲近母语成功打通了和中小学合作的路径。

「教师」这一角色反而是整个推进过程的关键角色。因为虽然已经开发出中文分级阅读标准及其配套工具和产品，但这些工具和产品依然需要人来使用，需要教育者来向这些孩子传递教育的温度和理念。但是，国内教育理念跟不上，语文教师对整个前沿教育的趋势掌握不到位......这些都是问题。

分级阅读进入国内的这些年，不是没有遭受过质疑之声，有人认为分级阅读不适应中国国情，比如有些孩子从小耳濡目染四大名著，可能会对超出分级阅读系统推荐的书目以外的书籍感兴趣，当然不能排除这种可能性。

分级阅读系统只是一种工具，它并不能喧宾夺主说可以取代老师。做分级阅读的意义就在于，想告诉家长和老师，哪种文本难度的书目是适合你的孩子或学生去阅读的。至于读还是不读，依然需要家长和老师去做出判断。

亲近母语持续研究中文分级阅读，打造中文分级阅读产品体系

当前文章标签：

最新热门

首页资讯列表

热门标签