207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus!

207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus (Quelle Wikipedia). Wer also 207 Wörter schreiben kann, kann schon die hälfte des deutschen Textes schreiben. Für einen Textparser brauchte ich eine Java Methode die checkt, ob ein Wort in dieser Liste ist.

Love never fails

Also mal eben eine Java-Zweizeiler um das zu überprüfen.

/**
	 * Testet ob das Wort eines der 207 häufigsten in der Deutschen Sprache ist
	 * 
	 * @param wort das zu überprüfende Word
	 * @return true wenn das Wort eines der TOP 207 Wörte ist, sonst false
	 */
	public static boolean isTop207DeWort(String wort) {

		// 207 Häufigsten Wörter in Deutschland
		// https://de.wikipedia.org/wiki/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache
		// das sind gleich 50% des Textes
		ArrayList<String> stopWoerter = new ArrayList<>(Arrays.asList("die", "der", "und", "in", "zu", "den", "das",
				"nicht", "von", "sie", "ist", "des", "sich", "mit", "dem", "dass", "er", "es", "ein", "ich", "auf",
				"so", "eine", "auch", "als", "an", "nach", "wie", "im", "für", "man", "aber", "aus", "durch", "wenn",
				"nur", "war", "noch", "werden", "bei", "hat", "wir", "was", "wird", "sein", "einen", "welche", "sind",
				"oder", "zur", "um", "haben", "einer", "mir", "über", "ihm", "diese", "einem", "ihr", "uns", "da",
				"zum", "kann", "doch", "vor", "dieser", "mich", "ihn", "du", "hatte", "seine", "mehr", "am", "denn",
				"nun", "unter", "sehr", "selbst", "schon", "hier", "bis", "habe", "ihre", "dann", "ihnen", "seiner",
				"alle", "wieder", "meine", "zeit", "gegen", "vom", "ganz", "einzelnen", "wo", "muss", "ohne", "eines",
				"können", "sei", "ja", "wurde", "jetzt", "immer", "seinen", "wohl", "dieses", "ihren", "würde",
				"diesen", "sondern", "weil", "welcher", "nichts", "diesem", "alles", "waren", "will", "herr", "viel",
				"mein", "also", "soll", "worden", "lassen", "dies", "machen", "ihrer", "weiter", "leben", "recht",
				"etwas", "keine", "seinem", "ob", "dir", "allen", "großen", "jahre", "weise", "müssen", "welches",
				"wäre", "erst", "einmal", "mann", "hätte", "zwei", "dich", "allein", "herren", "während", "paragraph",
				"anders", "liebe", "kein", "damit", "gar", "hand", "herrn", "euch", "sollte", "konnte", "ersten",
				"deren", "zwischen", "wollen", "denen", "dessen", "sagen", "bin", "menschen", "gut", "darauf", "wurden",
				"weiß", "gewesen", "Seite", "bald", "weit", "große", "solche", "hatten", "eben", "andern", "beiden",
				"macht", "sehen", "ganze", "anderen", "lange", "wer", "ihrem", "zwar", "gemacht", "dort", "kommen",
				"welt", "heute", "frau", "werde", "derselben", "ganzen", "deutschen", "lässt", "vielleicht", "meiner"));

		return stopWoerter.contains(wort.toLowerCase());

	}

Und zwei kleine JUnit 5 Test Methoden. Das Wort Liebe ist auch in der TOP-207-Liste enthalten. Also „Die Liebe versagt nie!“ und kommt häufig vor 😉 …

207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus!

Alles GRÜN:

207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus!

Love never fails! …

Ähnliche Artikel:

  1. Arduino Nano Programm und Video: Anzeige der 100 am meisten verwendeten Wörter in Englisch
  2. Java Quickie: Iterieren mit forEach über eine Collection (von Mindmaps) mit Lambda expressions
  3. Fussball Weltmeisterschaft 2018: Was soll ich machen?

wallpaper-1019588
KiVVON: Der Game-Changer für Content-Creators
wallpaper-1019588
Mexikanische Burrito Bowl mit Pico de Gallo (Vegan)
wallpaper-1019588
The Great Cleric: Serie wird auf Disc erscheinen
wallpaper-1019588
Why Raeliana Ended Up at the Duke’s Mansion: Disc-Release geplant