Så här läser du XML-filer direkt från disken i ett DataStage parallellt jobb
svar
XML-inmatningssteget måste ta en enda kolumn som inmatning. Det är möjligt att konfigurera XML-inmatningssteget för att acceptera antingen hela innehållet i ett XML-dokument eller en fil ( eller URL) sökväg där det faktiska dokumentinnehållet kan läsas från. Att konfigurera XML-Inmatningssteget för att acceptera filvägen är det bästa alternativet för parallella jobb. XML – inmatningssteget öppnar sedan filen som inmatningsström och läser filen direkt från disken utan att ändra den på något sätt. Denna metod är snabbare, förbrukar mindre resurser och är mycket mindre felbenägen än att använda ett sekventiellt filstadium.
sökvägsmetoden kräver ett sätt att generera hela sökvägen till filen (eller filerna) som sedan skickas till XML-inmatningssteget. Den externa källan scenen gör ett utmärkt jobb som ger denna förmåga. Den externa källan scenen kommer punga ut och köra alla körbara program, och sedan omdirigera standardutmatningen av det programmet i jobbet. För att få en lista över filvägarna kan vi låta det externa Källstadiet köra ’sök’ – programmet som vanligtvis ingår i ett Unix-eller Linux-operativsystem. På Windows-plattformen tillhandahålls detta program också som en del av MKS Toolkit som installeras automatiskt av Datastageinstallationen.
här är ett exempel på hur sökprogrammet kan producera hela sökvägen till XML-dokument som ouput:
sök /data/input-name ”*.xml ” – print
kör programmet med dessa argument kommer att producera en lista med fullständiga sökvägar till varje fil som slutar med .xml-tillägg i katalogen/data / input eller någon av dess underkataloger. Utgången kommer att ha en filväg per rad, avslutas med ett nytt radtecken.