您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 查找《论语》高频字的方法及对高频字分析的一点心得
用Office办公软件对《论语》和《道德经》高频字进行研究的一点心得伊长虹《论语》是孔子的学生编录的有关孔子言论和行为的一本书。它集中体现了孔子一生的思想、观念和抱负。“半部《论语》治天下”的说法,从一个侧面反映了《论语》一书对中国政治、文化的影响之大。《论语》一书的内容,涉及很多如何做人的道理。“修身、齐家、治国、平天下。”的理念贯穿其间。因为想了解有关学习与学习方法、品德与品德修养等内容在该书中占有多大比重,本文从找出和分析高频字入手,对《论语》进行了一些研究。作为比较,同时也对老子《道德经》的高频字进行了相同的统计。无意插柳中得到如下一些心得。一、找出高频字的方法:第一步:在互连网上通过搜索引擎,找到一个比较适合Word编辑的《论语》版本。第二步:将网页中的《论语》复制粘贴到Word文档。第三步:使用Word“编辑”菜单中的“查找与替换”功能,清除所有的标点符号。第四步:使用Word“工具”中的“字数统计”得到《论语》全文(含各篇标题),共计15828个字。第五步:使用Word“编辑”菜单中的“查找与替换”功能,找出高频字的出现次数。(逐字查找并清除)第六步:将找出的高频字及其频数输入到Excel表格中。第七步:使用Excel表格的排序功能,将高频字按频数高低排列。第八步:使用Excel表格的计算功能,求出各高频字占全文总字数的百分比。同时也根据排序序列对高频字进行累计和累计百分比的计算。通过以上步骤便得到《论语》高频字统计表。用同样的方法得到《道德经》高频字统计表。二、《论语》高频字统计表:全文总字数:15828编号高频字出现次数百分比高频字累计累计百分比1子9756.16%9756.16%2曰7594.80%173410.96%3之6123.87%234614.82%4不5823.68%292818.50%5也5323.36%346021.86%6而3442.17%380424.03%7其2701.71%407425.74%8人2191.38%429327.12%9者2191.38%451228.51%10以2111.33%472329.84%11有2011.27%492431.11%12矣1801.14%510432.25%13为1711.08%527533.33%14君1591.00%543434.33%15乎1591.00%559335.34%16可1560.99%574936.32%17如1530.97%590237.29%18与1440.91%604638.20%19言1300.82%617639.02%20无1290.82%630539.83%21则1250.79%643040.62%22问1210.76%655141.39%23知1200.76%667142.15%24何1180.75%678942.89%25吾1130.71%690243.61%26仁1100.69%701244.30%27君子1070.68%711944.98%28道890.56%720845.54%29焉880.56%729646.10%30行820.52%737846.61%31谓780.49%745647.11%32礼750.47%753147.58%33必750.47%760648.05%34三720.45%767848.51%35斯700.44%774848.95%36能690.44%781749.39%37学660.42%788349.80%38事610.39%794450.19%39是600.38%800450.57%40公590.37%806350.94%三、老子《道德经》高频字统计表:全文总字数5262编号高频字频数累计数百分数累计百分比1之2432434.62%4.62%2不2354784.47%9.08%3以1606383.04%12.12%4其1367742.58%14.71%5而1188922.24%16.95%6为11310052.15%19.10%7无9811031.86%20.96%8天9211951.75%22.71%9者8912841.69%24.40%10人8513691.62%26.02%11有8214511.56%27.58%12下8015311.52%29.10%13道7716081.46%30.56%14故6716751.27%31.83%15是6617411.25%33.09%16知5617971.06%34.15%17善5118480.97%35.12%18于4818960.91%36.03%19若4619420.87%36.91%20德4319850.82%37.72%21可3520200.67%38.39%22生3520550.67%39.05%23物3420890.65%39.70%24能3321220.63%40.33%25民3221540.61%40.94%26则3221860.61%41.54%27自3222180.61%42.15%28夫3122490.59%42.74%29得3122800.59%43.33%30谓3023100.57%43.90%31圣3023400.57%44.47%32常2923690.55%45.02%33兮2823970.53%45.55%34所2524220.48%46.03%35曰2324450.44%46.47%36欲2324680.44%46.90%37身2324910.44%47.34%38名2225130.42%47.76%39强2225350.42%48.18%40用2225570.42%48.59%41吾2225790.42%49.01%42将2226010.42%49.43%43事2126220.40%49.83%44言2126430.40%50.23%四、统计结果分析:从《论语》高频字列表中我们看到的结果是:1、排在第一位、第二位的分别是“子”字,出现975次,占总字数的6.2%;“曰”字,出现759次,占总字数的4.8%。二字合计占总字数的11%。这是《论语》一书在文字上最显著的一个特点。2、前10个高频字约占总字数的30%;前20个高频字约占总字数的40%;前30个高频字约占总字数的46%;前40个高频字约占总字数的50%。3、“之”、“乎”、“者”、“也”四个虚词占总字数的9.61%。4、“子”、“曰”、“之”、“乎”、“者”、“也”六个字超过总字数的20%。与之相对照的《道德经》则:1、排在第一位、第二位的分别是“之”、“不”,占总字数的9%。2、前10个高频字约占总字数的26%;3、前20个高频字约占总字数的37%;4、前30个高频字约占总字数的44%;5、“之”、“乎”、“者”、“也”四个虚词占总字数的6.69%;6、二文的前11个高频字中有9个相同的字;7、撇除《论语》中较特殊的“子”、“曰”两个高频字后,二文高频字占全文总字数的比例非常接近;8、如果撇除《论语》中较特殊的“子”、“曰”两个高频字,则二文中的“之”、“不”、“而”、“其”四个字的高频顺序基本相同。此外,“人”、“以”、“为”、“者”、“有”等高频字的顺序也差异不大。五、结论:统计分析的结果告诉我们:在孔子、老子生活的那个时代的人们,其写作习惯存在着常用字高度集中的倾向。在《论语》一书中前40个高频字竟占全书总字数的50%,在《道德经》一书中前30个高频字也占全书总字数的44%。这无疑是一个惊人的比值。另外,二文的前11个高频字中竟有9个相同的字。而此后的其他高频字则差异很大。这说明:1、二文前11个(合计13个)高频字“之、不、以、其、而、为、无、天、者、人、有、也、矣”通用性较强。2、其他高频字因文章属性不同,作者不同,而差异较大。
本文标题:查找《论语》高频字的方法及对高频字分析的一点心得
链接地址:https://www.777doc.com/doc-2386861 .html