Zum Inhalt springen

Tokenseperated Parser

Der Tokenseperated Parser verarbeitet tokengetrennte Textdateien, z. B. CSV-Dateien, und überführt deren Inhalte in ein internes Tabellenformat im Prozesskontext.

Die Trennung der Spalten erfolgt über ein konfigurierbares Trennzeichen.

Konfigurationsparameter

Feld Beschreibung
Quelle Die Quelle bestimmt, auf welchen Daten die Komponente ihre Operationen ausführt.
Automapping Definiert, ob alle vorhandenen Spalten automatisch übernommen werden sollen.
Spalten Definiert einzelne Spalten, die gezielt aus der Quelle übernommen werden sollen.
Hat Kopfzeile Definiert, ob die Quelle eine Kopfzeile enthält, die beim Einlesen übersprungen werden soll.
Trennzeichen Definiert das Zeichen, das zur Trennung der Spalten verwendet wird, z. B. ;, , oder |.
Ausgabename Definiert den Namen der im Prozess erzeugten Datentabelle.
Anführungszeichen entfernen Definiert, ob umschließende Anführungszeichen je Feld entfernt werden sollen.
Encoding Definiert das Zeichensatz-Encoding der Quelle, um eine korrekte Verarbeitung sicherzustellen, z. B. UTF-8 oder ISO-8859-1.

Struktur der Spaltendefinition

Attribut Beschreibung
Spaltenindex Numerischer Index der auszulesenden Spalte (0-basiert oder gemäß Implementierung).
Spaltenname Name der Zielspalte im internen Tabellenformat.
Format Optionales Format, z. B. für Datums- oder Zahlenwerte.
Typ Definiert den Ziel-Datentyp des Wertes im Prozesskontext.

Unterstützte Datentypen

  • System.String
  • System.Int16
  • System.Int32
  • System.Int64
  • System.Bool
  • System.Float
  • System.Double
  • System.Decimal

Verarbeitung

  • Die Komponente liest die Datei aus der definierten Quelle unter Berücksichtigung des konfigurierten Encoding.
  • Die Datei wird zeilenweise verarbeitet.
  • Jede Zeile wird anhand des definierten Trennzeichen in Spalten zerlegt.
  • Optional wird eine vorhandene Kopfzeile übersprungen.
  • Bei aktiviertem Automapping werden alle Spalten übernommen.
  • Bei deaktiviertem Automapping werden ausschließlich die definierten Spalten verarbeitet.
  • Optional werden Anführungszeichen entfernt.
  • Optional erfolgen Format- und Typkonvertierungen.
  • Jede verarbeitete Zeile erzeugt eine neue Tabellenzeile im Element Ausgabename.
Zuletzt aktualisiert am