博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
201671030108 +词频统计软件项目报告
阅读量:4495 次
发布时间:2019-06-08

本文共 3558 字,大约阅读时间需要 11 分钟。

任务一:

需求分析

  • 使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发。软件基本功能要求如下:
    1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
    2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
    3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
    4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt
    根据实验要求得出如下功能需求:
    1.指定单词词频统计功能
    2.高频词统计功能
    3.统计该文本所有单词数量及词频数

功能设计

  • 根据实验要求分为基本功能和扩展功能如下:
    1.基本功能(3项):指定单词词频统计功能、高频词统计功能、统计该文本所有单词数量及词频数按字典顺序输出的功能同时生成result.txt文件。
    2.扩展功能(1项):将词频数降序排列的功能。

设计实现

  • 设计了主类Main.java,接口类CountDao.java,接口实现类Count.java。

    主类功能是显示功能选项,进行功能接口调用;接口类功能是调用接口实现类即调用具体功能;接口实现类主要用来编写具体实现功能。
    设计实现流程图如下:
    1616082-20190319214018206-540023128.png

    测试运行

  • 本次设计一共实现了4项功能,测试结果如下图所示:

    图一
    图二
    图三
    图四

    优秀代码展示

  • 统计文本文件中的单词个数

    //通过键值对的方式去分别存储单词和出现的次数   //Map
    map = new TreeMap
    (); //创建一个words数组,将split分割的字符串存入数组 String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]"); for (int i = 0; i < words.length; i++) { String key = words[i].toLowerCase();//将所有单词转化为小写 if (key.length() > 0) { //用containsKey判断map集合对象中是否包含某个字符串 if (!map.containsKey(key)) {//如果不包括说明第一次出现,则给频率值赋1; map.put(key, 1); } else {// 如果不是第一次出现,就把value值++,那么value值是多少就是出现了几次 int value = map.get(key);//用get(key)获取对应的value值 value++; map.put(key, value); } } }
  • 按照指定单词查询出现次数

System.out.print("请输入想查询的单词:");        Scanner scan1 = new Scanner(System.in);        String word = scan1.nextLine();        //判断是否存在所要查询的单词        boolean b = map.containsKey(word);        if(b){            //根据key单词查找次数value            for (Map.Entry
m :map.entrySet()) { if (m.getKey().equals(word)) { int v = m.getValue(); System.out.println(v); }} }else { System.out.println("此单词不存在!"); }
  • value按照降序排列输出map
//按照value降序排列map         List
> nlist = new LinkedList
>(map.entrySet()); Collections.sort(nlist, new Comparator
>() { @Override public int compare(Map.Entry
o1, Map.Entry
o2) { int compare = (o1.getValue()).compareTo(o2.getValue()); return -compare; } }); Map
result = new LinkedHashMap
(); for (Map.Entry
entry : nlist) { result.put(entry.getKey(), entry.getValue()); } for (String a : result.keySet()) { System.out.println( a + "-----" + result.get(a)); }
  • 对key按照字典顺序输出map
//利用TreeMap实现Comparator接口        Comparator
> valueComparator = new Comparator
>() { public int compare(Map.Entry
o1,Map.Entry
o2) { return o1.getKey().compareTo(o2.getKey());//降序排序 } }; //map转换成list进行排序,Entry是Map中的一个静态内部类,用来表示Map中的每个键值对 //map.EntrySet(),实现了Set接口,里面存放的是键值对. List
> list = new ArrayList
>(map.entrySet()); // 排序 Collections.sort(list,valueComparator); System.out.println("已生成result.txt文件"); System.out.println("-----------------所有单词按字典顺序排序如下---------------"); for (Map.Entry
entry : list) { System.out.println(entry.getKey() + "----" + entry.getValue()); bufferedWriter.write(entry.getKey()+"----"+entry.getValue()+"\r\n"); }

总结

  • 在设计的过程中主要遵循“低耦合高内聚”的模块化原则,本人在实验中设计一个Main主类的基础上通过接口调用接口实现类来实现其他各个功能,以达到实验要求同时便于分而治之的编写需要实现的4个功能。

    任务二:

  • 将包含任务1源码的完整工程文件提交到已注册的Github账号下的项目仓库中

    我的本次设计代码你可以在完整查看

    任务三:

    本次设计的PSP

    1616082-20190319213116311-678397312.png

    总结

  • 这次设计在刚刚开始的设计部分花了很多的时间,主要是不知道从哪儿下手,而且自己的编程功底也不是很好,所以在完成此次设计的时候花费了很多的时间,也找了很多的资料来进一步了解JAVA语言的使用。但是这次设计也没有很完整,没有实现柱状图的功能,对于不熟悉和未实现的功能我会在以后的学习中更加努力的补回来。

转载于:https://www.cnblogs.com/jsj-hxl/p/10561076.html

你可能感兴趣的文章
纯C语言跑分(详细注释)
查看>>
JQuery Ajax 在asp.net中使用总结
查看>>
(转)如何在maven的pom.xml中添加本地jar包
查看>>
JSLink and Display Templates Part 6 – Creating View Templates and Deployment Options
查看>>
Android应用内实现视频播放--腾讯浏览服务(TBS)
查看>>
线程锁和自旋锁的比较
查看>>
手机端页面自适应最简单解决方案—rem布局
查看>>
成为一名优秀程序员所需要知道的15件事
查看>>
python之排序(sort/sorted)
查看>>
读书心得
查看>>
docker使用阿里云镜像加速器(属于自己的专属加速器)
查看>>
css基础5
查看>>
白盒测试与黑盒测试
查看>>
为什么你要用 Spring?
查看>>
94. 二叉树的中序遍历
查看>>
接口详解例子代码(附Java1.8的接口新特性)
查看>>
unity3d 关于断点下载和整个下载(用于更新)
查看>>
神经网络权值为什么不能初始化为零(1)
查看>>
C/C++(内存管理)
查看>>
项目Beta冲刺(团队)——用户试用调查报告
查看>>