Cum se citesc fișierele XML direct de pe disc într-o lucrare paralelă DataStage

răspuns

etapa de intrare XML trebuie să ia o singură coloană ca intrare. Este posibil să configurați etapa de intrare XML pentru a accepta fie întregul conținut al unui document XML, fie o cale de fișier ( sau URL) de unde poate fi citit conținutul real al documentului. Configurarea etapei de intrare XML pentru a accepta calea fișierului este cea mai bună opțiune pentru lucrările paralele. Etapa de intrare XML va deschide apoi fișierul ca flux de intrare și va citi fișierul direct de pe disc fără a-l modifica în niciun fel. Această metodă este mai rapidă, consumă mai puține resurse și este mult mai puțin predispusă la erori decât utilizarea unei etape de fișier secvențial.

metoda path necesită o modalitate de a genera calea completă către Fișier (sau fișiere), care va fi apoi trecut la etapa de intrare XML. Etapa sursă externă face o treabă excelentă oferind această capacitate. Etapa sursă externă va scoate și va rula orice program executabil, apoi va redirecționa ieșirea standard a acelui program în lucrare. Pentru a obține o listă a căilor de fișiere, putem avea etapa sursă externă rula programul ‘find’, care este de obicei inclus cu un sistem de operare Unix sau Linux. Pe platforma Windows, acest program este furnizat și ca parte a setului de instrumente MKS care este instalat automat de instalarea DataStage.

Iată un exemplu despre modul în care programul find poate produce calea completă către documentele XML ca ouput:

find /data/input-name „*.xml ” – print

rularea programului cu aceste argumente va produce o listă de căi complete pentru fiecare fișier care se termină cu .extensie xml în directorul/data / input sau oricare dintre subdirectoarele sale. Ieșirea va avea o cale de fișier pe linie, terminată cu un nou caracter de linie.

Leave a Reply

Adresa ta de email nu va fi publicată.