Hogyan kell olvasni XML fájlokat közvetlenül a lemezről a DataStage párhuzamos munkát
válasz
az XML bemeneti szakaszban kell venni egy oszlopot bemenetként. Lehetőség van beállítani az XML bemeneti szakaszban, hogy elfogadja akár a teljes tartalmát egy XML dokumentum vagy egy fájl (vagy URL) elérési utat, ahol a tényleges dokumentum tartalmát lehet olvasni. Az XML bemeneti szakasz beállítása a fájl elérési útjának elfogadására a legjobb megoldás párhuzamos feladatokhoz. Az XML bemeneti szakasz ezután megnyitja a fájlt bemeneti adatfolyamként, és közvetlenül a lemezről olvassa el a fájlt anélkül, hogy bármilyen módon megváltoztatná. Ez a módszer gyorsabb, kevesebb erőforrást igényel, és sokkal kevésbé hajlamos a hibákra, mint a szekvenciális fájlszakasz használata.
az elérési út módszer megköveteli a fájl (vagy fájlok) teljes elérési útjának generálását, amelyet ezután átadnak az XML bemeneti szakasznak. A külső forrás szakasz kiváló munkát végez ennek a képességnek a biztosításában. A külső forrás szakasz minden futtatható programot lefuttat, majd átirányítja a program szabványos kimenetét a feladatba. A fájl elérési útjainak listájához a külső forrás szakaszban futtathatjuk a’ find ‘ programot, amelyet általában egy Unix vagy Linux operációs rendszer tartalmaz. A Windows platformon ez a program az MKS eszközkészlet részeként is rendelkezésre áll, amelyet a DataStage telepítés automatikusan telepít.
íme egy példa arra, hogy a find program hogyan tudja előállítani az XML dokumentumok teljes elérési útját ouput néven:
find /data/input-name “*.xml ” – print
a program futtatása ezekkel az argumentumokkal elkészíti az egyes fájlok teljes elérési útjainak listáját .xml kiterjesztés a / data / input könyvtárban vagy annak bármely alkönyvtárában. A kimenetnek soronként egy fájl elérési útja lesz, új sor karakterrel lezárva.