日期:2011-03-22 16:17:00 来源:本站整理
<b>StreamTokenizer</b>[Java编程]
本文“<b>StreamTokenizer</b>[Java编程]”是由七道奇为您精心收集,来源于网络转载,文章版权归文章作者所有,本站不对其观点以及内容做任何评价,请读者自行判断,以下是其具体内容:
固然StreamTokenizer并非从InputStream或OutputStream衍生的,但它只伴随InputStream工作,所以非常恰本地包含在库的IO部份中.
StreamTokenizer类用于将任何InputStream分割为一系列“暗号”(Token).这些暗号实际是一些断续的文本块,中间用我们挑选的任何东西脱离.比方,我们的暗号可以是单词,中间用空白(空格)以及标点标记脱离.
下面是一个简单的程序,用于计算各个单词在文本文件中反复呈现的次数:
最好将后果按排序格局输出,但由于Java 1.0和Java 1.1都没有供应任何排序办法,所以必须由自己着手.这个目标可用一个StrSortVector便利地达成(成立于第8章,属于那一章成立的软件包的一部份.记着本书全部子目录的起始目录都必须位于类途径中,不然程序将不能精确地编译).//: SortedWordCount.java // Counts words in a file, outputs // results in sorted form. import java.io.*; import java.util.*; import c08.*; // Contains StrSortVector class Counter { private int i = 1; int read() { return i; } void increment() { i++; } } public class SortedWordCount { private FileInputStream file; private StreamTokenizer st; private Hashtable counts = new Hashtable(); SortedWordCount(String filename) throws FileNotFoundException { try { file = new FileInputStream(filename); st = new StreamTokenizer(file); st.ordinaryChar('.'); st.ordinaryChar('-'); } catch(FileNotFoundException e) { System.out.println( "Could not open " + filename); throw e; } } void cleanup() { try { file.close(); } catch(IOException e) { System.out.println( "file.close() unsuccessful"); } } void countWords() { try { while(st.nextToken() != StreamTokenizer.TT_EOF) { String s; switch(st.ttype) { case StreamTokenizer.TT_EOL: s = new String("EOL"); break; case StreamTokenizer.TT_NUMBER: s = Double.toString(st.nval); break; case StreamTokenizer.TT_WORD: s = st.sval; // Already a String break; default: // single character in ttype s = String.valueOf((char)st.ttype); } if(counts.containsKey(s)) ((Counter)counts.get(s)).increment(); else counts.put(s, new Counter()); } } catch(IOException e) { System.out.println( "st.nextToken() unsuccessful"); } } Enumeration values() { return counts.elements(); } Enumeration keys() { return counts.keys(); } Counter getCounter(String s) { return (Counter)counts.get(s); } Enumeration sortedKeys() { Enumeration e = counts.keys(); StrSortVector sv = new StrSortVector(); while(e.hasMoreElements()) sv.addElement((String)e.nextElement()); // This call forces a sort: return sv.elements(); } public static void main(String[] args) { try { SortedWordCount wc = new SortedWordCount(args[0]); wc.countWords(); Enumeration keys = wc.sortedKeys(); while(keys.hasMoreElements()) { String key = (String)keys.nextElement(); System.out.println(key + ": " + wc.getCounter(key).read()); } wc.cleanup(); } catch(Exception e) { e.printStackTrace(); } } } ///:~
为翻开文件,利用了一个FileInputStream.并且为了将文件转换成单词,从FileInputStream中成立了一个StreamTokenizer.在StreamTokenizer中,存在一个默许的脱离符列表,我们可用一系列办法加入更多的脱离符.在这里,我们用ordinaryChar()指出“该字符没有分外重要的意义”,所以解析器不会把它当作自己成立的任何单词的一部份.比方,st.ordinaryChar('.')表示小数点不会成为解析出来的单词的一部份.在与Java配套供应的联机文档中,可以找到更多的相关信息.
在countWords()中,每次从数据流中取出一个暗号,而ttype信息的作用是判断对每个暗号采纳什么操作——因为暗号大概代表一个行尾、一个数字、一个字串大概一个字符.
找到一个暗号后,会查询Hashtable counts,核实此中能否已经以“键”(Key)的情势包含了一个暗号.若答案是必定的,对应的Counter(计数器)对象就会增值,指出已找到该单词的另一个实例.若答案为否,则新建一个Counter——因为Counter构建器会将它的值初始化为1,恰是我们计算单词数目时的要求.
SortedWordCount并不属于Hashtable(散列表)的一种范例,所以它不会担当.它履行的一种特定范例的操作,所以固然keys()和values()办法都必须重新揭暴露来,但仍不表示应利用那个担当,因为大量Hashtable办法在这里都是不得当的.除此以外,关于另一些办法来说(比方getCounter()——用于得到一个特定字串的计数器;又如sortedKeys()——用于产生一个列举),它们终究都改变了SortedWordCount接口的情势.
在main()内,我们用SortedWordCount翻开和计算文件中的单词数目——总共只用了两行代码.随后,我们为一个排好序的键(单词)列表提取出一个列举.并用它得到每个键以及相关的Count(计数).注意必须调用cleanup(),不然文件不能正常关闭.
采取了StreamTokenizer的第二个例子将在第17章供应.
以上是“<b>StreamTokenizer</b>[Java编程]”的内容,如果你对以上该文章内容感兴趣,你可以看看七道奇为您推荐以下文章:
本文地址: | 与您的QQ/BBS好友分享! |
评论内容只代表网友观点,与本站立场无关!
评论摘要(共 0 条,得分 0 分,平均 0 分)
查看完整评论