Blogi

Houston Analytics Accelerator – läpimurto SPSS-Teradatan latausmenetelmissä

Työelämässä – kuten elämässä yleensäkin – on asioita, jotka rasittavat, mutta joita täytyy vain sietää. Vai täytyykö?? Yksi tällainen analyytikon arkea usein rasittava, mutta pakollinen työvaihe, todellinen aikasyöppö, on tietojen lataus kantaan, esimerkiksi Teradata Aster-alustalle. Käytännössä vaihtoehtoja on ollut kaksi:

Jos analyytikon aikasyöppöallergia on siedettävällä tasolla, valintana voi toimia SPSS + ODBC-malli eli helppo mutta hidas tapa ladata tietoja Asteriin. Malli toimii siis hyvin yöajoissa, mutta sekään ei aina riitä.

Toinen vaihtoehto on valita nopea, mutta vaikeusasteeltaan haastavampi tapa: NCluster Loader säästää runsaasti aikaa, mutta vaatii useita työvaiheita ja erikoisosaamista, on useimmissa tapauksissa helposti enemmän henkilöriippuvainen. Riskejä siis piilee nopeudessakin.

Nopea ja helppo lataus IBM SPSS Modelerista Teradata Asteriin

Enää ei enää tarvitse tehdä valintaa nopeuden ja helppouden välillä. Houston Analytics on kehittänyt hermoja raastavaan tarpeeseen kolmannen ratkaisun, joka on sekä nopea että helppo: Accelerator. Se on työväline, joka yhdessä SPSS:n ja NClusterin kanssa muodostaa kokonaisuuden, joka kampittaa sekä SPSS+ODBC-mallin hitauden, että NCluster Loaderin haasteellisuuden. Kehitystiimin mukaan, Acceleraattorin käyttö on niin helppoa, että datan lataaminen onnistuu keneltä vain.

Accelerator ratkaisee analyytikon arkeen kuuluvat Teradatan Aster-alustan datalatauksien aikahaasteet. Hienoa mm. IoT-maailmassa latausaikojen kanssa tuskaileville. Latausajat supistuvat dramaattisesti. Esimerkiksi 1 000 000 rivin latausaika supistuu Acceleratorin avulla vuorokaudesta viiteen sekuntiin.

Enää ei tarvitse täyttää uima-allasta litran mitalla tai kaivella täyttöä varten autotallin perältä vesipumppua, sillä vesiletku on keksitty. Sama analogia on nyt mahdollista ottaa käyttöön datamaailmassa.

Ville Laitinen, CTO Houston Analytics