Wissen lebt Online

Daten für Bildungs-anwendungen und KI-Training

Metadaten-Bestand – Lerninhalte und Bildungsressourcen

Der Metadaten-Bestand enthält mehrere hunderttausend Datensätze zu Lernmaterialien, Quellen und Bildungsangeboten.

Die Datensätze sind maschinenlesbar und enthalten Informationen wie Titel, Beschreibungen, Bildungsstufe, Lizenzinformationen sowie pädagogische und technische Attribute. Materialien lassen sich so effizient finden, filtern und für Lernpfade nutzen.

Darüber hinaus eignet sich der Metadaten-Bestand für KI-Anwendungen: LLMs können Inhalte klassifizieren, Zusammenfassungen erstellen oder Frage-Antwort-Paare generieren. Für Qualitätssicherung, Verschlagwortung und Integration in Lernplattformen bieten die Metadaten eine Grundlage zur systematischen Erschließung und Nutzung.

Themenbäume und Sammlungen – Redaktionsgepflegte, geordnete Lerninhalte

Die WLO-Themenbäume bestehen aus rund 3.000 redaktionell gepflegten Sammlungen, die Lerninhalte systematisch nach Fächern, Themen und Kompetenzen ordnen. Jede Sammlung verknüpft die zugehörigen Lernressourcen, Kompendialtexte und Frage-Antwort-Paare für einen strukturierten Überblick.

Für KI-Anwendungen bieten die Themenbäume eine wertvolle Grundlage zur semantischen Analyse, automatischen Klassifikation und Generierung weiterer Inhalte. LLMs können darauf basierende Kompendialtexte oder Quizfragen erstellen. Die hierarchische Organisation ermöglicht präzise Filterung, Qualitätsprüfung und Nachnutzung der Inhalte.

Refined Data – KI-gestützte Datenprodukte aus WLO-Inhalten

Auf Basis der Rohdaten entstehen durch KI-Verarbeitung und redaktionelle Kuration hochwertige abgeleitete Datenprodukte. Diese umfassen kompendiale Texte, Frage-Antwort-Paare und vortrainierte NLP-Modelle für den Bildungsbereich.

Refined Data aus WLO eignet sich direkt für den Einsatz in Lernplattformen, Tutorensystemen und KI-Pipelines. Die Produkte sind modular nutzbar und lassen sich flexibel in bestehende Bildungsinfrastrukturen integrieren.

Kompendiale Texte

Kompendiale Texte sind didaktisch aufbereitete Übersichtstexte zu Themen und Kompetenzbereichen aus kuratierten OER-Quellen. Sie bieten strukturierte Wissensdarstellungen auf unterschiedlichen Komplexitätsstufen.

Sie dienen als Grundlage für Lernmaterialien, KI-Tutoring-Systeme und automatisierte Content-Generierung. KI-gestützte Qualitätsprüfung sichert Aktualität und inhaltliche Korrektheit.

Volltexte – Extrahierte Textdaten aus OER-Quellen

Die WLO-Volltexte umfassen extrahierte Textinhalte aus tausenden geprüften OER-Quellen in maschinenlesbarer Form. Sie bilden eine umfangreiche Rohdatenbasis für NLP-Modelle und semantische Suchanwendungen.

Als Trainingsdaten für RAG-Pipelines und LLM-Finetuning lassen sie sich flexibel in ETL-Prozesse und bestehende KI-Infrastrukturen integrieren.

Frage-Antwort-Paare (QA)

QA-Paare sind strukturierte Frage-Antwort-Sets, die automatisch oder redaktionell aus Bildungsinhalten generiert werden. Sie eignen sich für Training und Evaluation von LLMs sowie für Chatbots und Tutorensysteme.

Durch Annotation kognitiver Level lassen sich Schwierigkeitsgrad und didaktischer Einsatz präzise steuern. Dies ermöglicht den gezielten Einsatz in Prüfungsformaten und adaptiven Lernsystemen.

Modelldaten (NLP/KI-Modelle)

Auf Basis der WLO-Datenbasis vortrainierte Modelle ermöglichen domänenspezifische Klassifikation, semantische Suche und automatische Empfehlungen. Sie werden als API, Embeddings oder spezialisierte Services bereitgestellt.

Die Modelle lassen sich direkt in Lernplattformen und Content-Management-Systeme integrieren und flexibel an spezifische Anwendungsfälle anpassen.

Metadaten-Vokabulare – Standardisierte Klassifikationen für Bildungsinhalte

Die Metadaten-Vokabulare basieren auf etablierten Standards wie SKOS und LOM und wurden in enger Zusammenarbeit mit Akteuren der OER- und Metadaten-Community entwickelt. Sie sind praxiserprobt und gemeinsam mit redaktionellen Teams kontinuierlich weiterentwickelt worden.

Als gemeinsame Sprache zwischen Redaktion, Plattformen und KI-Systemen ermöglichen sie automatische Annotation, Multi-Label-Klassifikation und interoperable Datennutzung. Sie sind Grundlage für Empfehlungssysteme, Curriculum Alignment und semantische Suche.

Knowledge Graphs – Maschinenlesbare Wissensstrukturen für den Bildungsbereich

Die Knowledge-Graphs bilden Bildungsinhalte, Themen und Kompetenzen als maschinenlesbare Wissensstrukturen ab. Durch gezielte Relationen zwischen Inhalten entsteht semantische Tiefe, die einfache Verzeichnisse und Klassifikationen weit übersteigt.

Diese vernetzten Strukturen ermöglichen präzise Content Recommendation, semantische Suche und das Training von Embedding-Modellen. Für KI-Anwendungen bieten sie eine leistungsfähige Grundlage, um Zusammenhänge zwischen Lernmaterialien, Konzepten und Curricula automatisiert zu erschließen.

Adaptionsvariablen – Lernereigenschaften für personalisierte Bildungserfahrungen

Adaptionsvariablen beschreiben relevante Eigenschaften von Lernenden wie Vorkenntnisse, Lernstil oder Kompetenzstand, die für die Steuerung adaptiver Lernsysteme benötigt werden. Sie bilden die Grundlage, um Lehr- und Lernprozesse individuell und zielgerichtet zu gestalten.

Durch die strukturierte Erfassung dieser Variablen können Lernmaterialien, Aufgaben und Lernpfade automatisiert auf den jeweiligen Lernenden abgestimmt werden. Dies ermöglicht eine präzise Personalisierung in digitalen Lernumgebungen und KI-gestützten Tutorensystemen.