German Commons: Forschende veröffentlichen größten offen lizenzierten deutschen Textkorpus

Stilisierter gelber Roboterarm auf Deutschlandflagge greift schwarzes neuronales Netzwerk über Datenblöcken

Ein Forschungsteam hat mit German Commons die bisher umfangreichste Sammlung explizit offen lizenzierter deutscher Texte zusammengestellt. Der Korpus soll die Entwicklung rechtlich unbedenklicher deutscher Sprachmodelle ermöglichen.

Der Artikel German Commons: Forschende veröffentlichen größten offen lizenzierten deutschen Textkorpus erschien zuerst auf The Decoder.