207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus!

Erstellt am 5. Juli 2019 von It_berater

207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus (Quelle Wikipedia). Wer also 207 Wörter schreiben kann, kann schon die hälfte des deutschen Textes schreiben. Für einen Textparser brauchte ich eine Java Methode die checkt, ob ein Wort in dieser Liste ist.

Also mal eben eine Java-Zweizeiler um das zu überprüfen.

/**
	 * Testet ob das Wort eines der 207 häufigsten in der Deutschen Sprache ist
	 * 
	 * @param wort das zu überprüfende Word
	 * @return true wenn das Wort eines der TOP 207 Wörte ist, sonst false
	 */
	public static boolean isTop207DeWort(String wort) {

		// 207 Häufigsten Wörter in Deutschland
		// https://de.wikipedia.org/wiki/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache
		// das sind gleich 50% des Textes
		ArrayList<String> stopWoerter = new ArrayList<>(Arrays.asList("die", "der", "und", "in", "zu", "den", "das",
				"nicht", "von", "sie", "ist", "des", "sich", "mit", "dem", "dass", "er", "es", "ein", "ich", "auf",
				"so", "eine", "auch", "als", "an", "nach", "wie", "im", "für", "man", "aber", "aus", "durch", "wenn",
				"nur", "war", "noch", "werden", "bei", "hat", "wir", "was", "wird", "sein", "einen", "welche", "sind",
				"oder", "zur", "um", "haben", "einer", "mir", "über", "ihm", "diese", "einem", "ihr", "uns", "da",
				"zum", "kann", "doch", "vor", "dieser", "mich", "ihn", "du", "hatte", "seine", "mehr", "am", "denn",
				"nun", "unter", "sehr", "selbst", "schon", "hier", "bis", "habe", "ihre", "dann", "ihnen", "seiner",
				"alle", "wieder", "meine", "zeit", "gegen", "vom", "ganz", "einzelnen", "wo", "muss", "ohne", "eines",
				"können", "sei", "ja", "wurde", "jetzt", "immer", "seinen", "wohl", "dieses", "ihren", "würde",
				"diesen", "sondern", "weil", "welcher", "nichts", "diesem", "alles", "waren", "will", "herr", "viel",
				"mein", "also", "soll", "worden", "lassen", "dies", "machen", "ihrer", "weiter", "leben", "recht",
				"etwas", "keine", "seinem", "ob", "dir", "allen", "großen", "jahre", "weise", "müssen", "welches",
				"wäre", "erst", "einmal", "mann", "hätte", "zwei", "dich", "allein", "herren", "während", "paragraph",
				"anders", "liebe", "kein", "damit", "gar", "hand", "herrn", "euch", "sollte", "konnte", "ersten",
				"deren", "zwischen", "wollen", "denen", "dessen", "sagen", "bin", "menschen", "gut", "darauf", "wurden",
				"weiß", "gewesen", "Seite", "bald", "weit", "große", "solche", "hatten", "eben", "andern", "beiden",
				"macht", "sehen", "ganze", "anderen", "lange", "wer", "ihrem", "zwar", "gemacht", "dort", "kommen",
				"welt", "heute", "frau", "werde", "derselben", "ganzen", "deutschen", "lässt", "vielleicht", "meiner"));

		return stopWoerter.contains(wort.toLowerCase());

	}

Und zwei kleine JUnit 5 Test Methoden. Das Wort Liebe ist auch in der TOP-207-Liste enthalten. Also „Die Liebe versagt nie!“ und kommt häufig vor 😉 …

Alles GRÜN:

Love never fails! …

Ähnliche Artikel:

  1. Arduino Nano Programm und Video: Anzeige der 100 am meisten verwendeten Wörter in Englisch
  2. Java Quickie: Iterieren mit forEach über eine Collection (von Mindmaps) mit Lambda expressions
  3. Fussball Weltmeisterschaft 2018: Was soll ich machen?