XML-tiedostojen lukeminen suoraan levyltä DataStage – rinnakkaistyössä
vastaus
XML-tulovaiheessa on otettava yksi sarake syötteeksi. XML-Tulovaihe on mahdollista määrittää niin, että se hyväksyy joko XML-asiakirjan koko sisällön tai tiedoston ( tai URL-polun), josta varsinainen asiakirjan sisältö voidaan lukea. XML Input-vaiheen määrittäminen tiedostopolun hyväksymiseksi on paras vaihtoehto rinnakkaistyöskentelyyn. XML-Tulovaihe avaa sitten tiedoston tulovirtana ja lukee tiedoston suoraan levyltä muuttamatta sitä millään tavalla. Tämä menetelmä on nopeampi, kuluttaa vähemmän resursseja ja on paljon vähemmän virhealtista kuin käyttämällä peräkkäistä tiedostovaihetta.
polkumenetelmä vaatii tavan luoda täydellinen polku tiedostoon (tai tiedostoihin), joka sitten siirretään XML-Tulovaiheeseen. Ulkoinen lähde vaiheessa tekee erinomaista työtä tarjoamalla tätä kykyä. Ulkoinen lähde vaiheessa shell out ja suorittaa suoritettavan ohjelman, ja sitten ohjata standardin ulostulo kyseisen ohjelman työhön. Saada luettelon tiedoston polkuja, voimme olla ulkoisen lähteen vaiheessa ajaa ’Etsi’ ohjelma, joka on yleisesti mukana Unix tai Linux-käyttöjärjestelmä. Windows-alustalla, tämä ohjelma on myös osana MKS Toolkit joka asennetaan automaattisesti DataStage asennus.
tässä on esimerkki siitä, miten find-ohjelma voi tuottaa koko polun XML-dokumentteihin nimellä ouput:
find /data/input-name ”*.xml ” – print
ohjelman ajaminen näillä argumenteilla tuottaa listan kaikista poluista jokaiseen tiedostoon, joka päättyy numeroon .XML-laajennus / data / input-hakemistossa tai sen alikansioissa. Tulosteessa on yksi tiedostopolku riviä kohti, joka päättyy uudella rivimerkillä.