Entwicklung

Dateiformate zum Datenaustausch

Diese Seite erklärt gebräuchliche Dateiformate wie CSV, XML und JSON, ihre Unterschiede und typische Einsatzbereiche im Datenaustausch.

Beim Datenaustausch zwischen Anwendungen oder Systemen spielen strukturierte Dateiformate eine zentrale Rolle. Gängige Formate sind CSV, XML und JSON. Sie ermöglichen es, Daten in einer plattformunabhängigen, lesbaren Form zu speichern und zu übertragen.


CSV – Comma-Separated Values

CSV ist ein einfaches textbasiertes Format, bei dem Daten zeilenweise organisiert sind. Jede Zeile stellt einen Datensatz dar, einzelne Werte sind durch ein Trennzeichen (z. B. Komma oder Semikolon) getrennt.

Eigenschaften:

  • Sehr einfach und kompakt
  • Leicht lesbar und mit Tabellenkalkulationsprogrammen wie Excel kompatibel
  • Keine verschachtelten Strukturen möglich

Typische Einsatzbereiche:

  • Export und Import von Daten in Tabellenform
  • Schnittstellen zwischen Datenbanken und Anwendungen

XML – Extensible Markup Language

XML ist ein textbasiertes Format zur Darstellung hierarchisch strukturierter Daten. Es verwendet Tags, um Daten zu beschreiben.

Eigenschaften:

  • Selbstbeschreibend durch frei definierbare Tags
  • Unterstützt komplexe und verschachtelte Strukturen
  • Weit verbreitet in standardisierten Datenaustauschformaten z. B. SOAP

Typische Einsatzbereiche:

  • Austausch strukturierter Daten zwischen Systemen
  • Konfigurationsdateien
  • Webservices (SOAP)

JSON – JavaScript Object Notation

JSON ist ein leichtgewichtiges Format zur Darstellung strukturierter Daten, das insbesondere in Webanwendungen verwendet wird. Es basiert auf der Syntax von JavaScript-Objekten.

Eigenschaften:

  • Kompakt und gut lesbar
  • Unterstützt komplexe, verschachtelte Datenstrukturen
  • In vielen Programmiersprachen direkt nutzbar

Typische Einsatzbereiche:

  • Kommunikation zwischen Client und Server in Webanwendungen (z. B. REST-APIs)
  • Datenformate in modernen Webframeworks

Unterschiede zwischen CSV und XML

KriteriumCSVXML
StrukturFlach (Tabellenform)Hierarchisch
LesbarkeitEinfach (für Menschen & Programme)Selbstbeschreibend, aber umfangreicher
ErweiterbarkeitEingeschränktHoch
FormatvalidierungNicht vorgesehenMöglich mit DTD oder XML Schema

Was bedeutet „well-formed“ und „valid“ bei XML?

  • Well-formed XML: Eine XML-Datei ist wohlgeformt, wenn sie den grundlegenden Syntaxregeln entspricht (z. B. korrekte Tag-Verschachtelung, ein Wurzelelement, Attributwerte in Anführungszeichen).
  • Valid XML: Eine XML-Datei ist valide, wenn sie zusätzlich zu den Syntaxregeln auch einem definierten Schema entspricht, z. B. einer DTD (Document Type Definition) oder einem XML Schema.

Wozu dient die DTD bei XML?

Die Document Type Definition (DTD) beschreibt die erlaubten Elemente und Strukturen in einer XML-Datei. Sie dient zur Validierung und stellt sicher, dass eine XML-Datei bestimmte Regeln einhält.

Funktionen einer DTD:

  • Definiert erlaubte Elemente und deren Reihenfolge
  • Bestimmt, welche Attribute ein Element haben darf
  • Ermöglicht die Validierung durch XML-Parser

DTD-Dateien können intern (innerhalb der XML-Datei) oder extern eingebunden werden.


Zusammenfassung

  • CSV eignet sich für einfache, tabellarische Daten.
  • XML ist flexibel und gut für komplexe Strukturen.
  • JSON ist leichtgewichtig und besonders im Webbereich beliebt.
  • Eine well-formed XML-Datei erfüllt die Syntaxregeln, eine valid XML-Datei erfüllt zusätzlich eine DTD oder ein Schema.
  • Die DTD hilft bei der Prüfung und Definition der XML-Struktur.