Javakurs/Übungsaufgaben/Textwordcount
Aufgabe
In dieser Aufgabe sollen verschiedene Texte von Johann Wolfgang von Goethe mit Texten von Karl May verglichen werden. Der Vergleich soll mit Hilfe eines Programms geschehen, welches in Java zu schreiben ist und welches für einen bestimmten Text ausgibt:
- aus wievielen Wörtern der Text besteht
- welches die 20 Wörter sind, die am häufigsten verwendet wurden
- wie viele unterschiedliche Wörter benutzt wurden
Hinweise
- Testet euer Programm erst mit selbstgeschrieben Texten, lasst dann die Texte der genannten Autoren durchlaufen.
- Die zu vergleichenden Texte müssen natürlich runtergeladen werden. Ihr findet Texte dieser Autoren unter Wikisource:
Das Einlesen von Dateien gestaltet sich in Java etwas komplizierter. Wir haben euch aus diesem Grunde hier, ähnlich wie bei der Terminaleingabe, eine Bibliotheksklasse gebaut, die euch ein wenig Arbeit abnimmt.
http://docs.freitagsrunde.org/Veranstaltungen/javakurs_2007/vorgaben/EasyFileAccess.java
Mit Hilfe der Funktion getFileContent(String filename) könnt ihr so den Inhalt einer kompletten Datei in ein String-Array lesen, wobei ein Feld im Array jeweils eine Zeile im Text darstellt:
String[] textContent = EasyFileAccess.getFileContent("Dateipfad");
Kommentare
Wenn du Anmerkungen zur Aufgabe hast oder Lob und Kritik loswerden möchtest, ist hier die richtige Stelle dafür. Klicke einfach ganz rechts auf "bearbeiten" und schreibe deinen Kommentar direkt ins Wiki. Keine Scheu, es geht nichts kaputt ;)
Die Texte gehen zum Teil nicht weil die nicht utf8 kodiert sind.