AI takler den enorme dataveksten

TU HP DataScience Albert1

– Mengden data øker konstant og finnes over alt rundt oss, og den blir stadig mer relevant for bedrifter som ønsker å overleve og klare seg i konkurransen mot andre selskaper, sier Albert Bruhner, Data Science Lead for Norden i HP.

Han mener at AI er den eneste måten bedrifter kan takle den eksponentielt voksende datastrømmen – og forteller at AI-utviklingen er på full fremmarsj, ikke bare hos teknisk avanserte startups og internasjonale tech-giganter, men også hos selskaper vi alle har med å gjøre til daglig.

Datavitenskap brukes i alle bransjer

– Dagligvarehandelen er et eksempel på en bransje som gjør enorme investeringer i AI, forteller Albert. Man ser blant annet på muligheten for å overvåke butikkhyller med kameraer, for så å la en AI si fra når det må fylles på i hylla, følge med på lagerbeholdningen, og ta seg av bestilling av flere produkter. I tillegg gir det en sikkerhetsgevinst, da AI-en kan oppdage tyveri ved å telle antallet varer i hyllene og måle det opp mot antallet produkter som går ut via kassene.

– Dagligvarekjeden Netto i Danmark har vunnet premier for utviklingen av AI-løsninger som følger med på utløpsdatoen på varer på lager. Det kastes jo normalt enormt mye mat, men dette systemet anbefaler priser til butikkene, slik at varene blir billigere jo kortere tid det er igjen til varen går ut på dato. Da rekker de å selge produktene før de må kaste dem.

– Det er overraskende mange som jobber med dette. Kleskjeden Hennes & Mauritz, for eksempel, har over tusen ansatte innen datavitenskap. De jobber med å effektivisere lagersaldo, prissetting, og mye mer.

– Strømselskapene legger også enorme ressurser i å samle inn og behandle data. Vindkraft, vannkraft – hvor mye vann er det i magasinene, hvor mye blåser det hvor, hvordan påvirker dette hverandre – det er data over alt, som må vurderes i sanntid, døgnet rundt.

TU HP DataScience Albert2
Albert Bruhner demonstrerer installasjon av HP Data Science Stack Manager på et HP Workstation-arrangement i Oslo.

– Så har vi bank og finans, fortsetter Albert. Det flyter enorme mengder penger verden rundt til enhver tid, og bankene er pliktige å oppdage og slå ned på mistenkelige handlinger, for å forhindre hvitvasking og svindel. Da trengs gode AI-modeller, og tusenvis av ansatte innen datavitenskap.

Teleselskapene får mye data om våre bevegelsesmønstre gjennom triangulering av smarttelefoner mellom basestasjonene. Det vet ikke minst Telia:

– Telia er kjent for Crowd Analytics, forteller Albert. Under pandemien kunne vi se hvor mye mindre vi kjørte bil og brukte tog. Denne kunnskapen kan brukes til praktiske avgjørelser innen byplanlegging. Hvor skal veiene gå? Hvor skal togene stoppe? Hva er naturlige møtepunkter? Hvor skal vi bygge matbutikker og kafeer? Data finnes, spørsmålet er bare hvordan vi bruker den, sier Bruhner.

Samarbeid mellom menneske og maskin

– For å få det beste ut av AI, må man ha et godt samarbeid mellom AI og mennesker. Formålet med mye AI-utvikling er å automatisere og forbedre kjedelige og repetitive oppgaver, slik at man kan minimere den menneskelige feilfaktoren – men for å lykkes med det, må man trene disse AI-modellene. Og det er det Data Science ofte handler om: Å først skape modellene, og så trene dem, slik at de blir bedre og bedre. Maskinlæring handler mye om at AI-ene lærer opp seg selv – men mennesker må fortsatt velge ut hvilke datamengder de skal gå gjennom.

TU HP DataScience sikkerdata
Med rack-monterte HP-arbeidsstasjoner sikres sensitiv data i bedriftens lokaler. Utviklerne kan jobbe på dem fra overalt med HP Anyware.

– Å velge ut data for maskinlæring er et veldig ømfintlig felt, påpeker Albert. Vi vil jo ikke skape fordommer hos AI-ene våre. Vi har jo eksempler på at kamera-AI ikke har klart å følge mørkhudede personer, fordi de hvite utviklerne ikke har tenkt på at de burde trent modellene på flere enn seg selv og sine lyshudede kolleger.

– Målet med AI-utviklinger er jo til syvende og sist å gjøre verden til et bedre sted, sier Albert Bruhner – men hvordan gjør vi det? Han mener vi må være obs på AI-etikk, hvor vi ser nøye på hva vi gjør og hvilke implikasjoner det vil få – ellers kan det hende vi ender opp med det motsatte.

Riktige verktøy sparer tid og penger

– Hvis man for eksempel er Machine Learning Engineer, jobber man ofte med kode og programmer som kan utnytte GPU. Men, hvis man jobber i en bedrift hvor IT-avdelingen deler ut samme standard-PC til alle ansatte, blir man tvunget til å benytte dyre sky-løsninger i stedet for å teste arbeidet sitt lokalt. Det handler om den kreative, iterative prosessen til utviklerne – og den har man ikke tid til å vente i timevis på. 

– Det slike ansatte trenger er en kraftigere PC med innebygget grafikkort – en såkalt mobil arbeidsstasjon, forklarer Albert. Da får de mye mer kraft og kan jobbe effektivt fra sin egen laptop, i stedet for å kaste bort tiden på å vente. Det handler om å ha riktig verktøy for å jobbe kreativt og produktivt.

TU HP DataScience utvikler
Når man jobber med maskinlæring og tunge datasett er det viktig å ha riktig verktøy.

– Det er også rimeligere, forteller han. Vi har sett sammenligninger hvor selskaper har målt hardware-investeringer opp mot å bruke GPU-akselererte skyløsninger. I snitt finner de at de kraftige arbeidsstasjonene de har kjøpt inn til utviklerne sine har betalt seg på bare syv måneder.

– En av våre Data Science-kunder har fortalt at den optimale løsningen for deres utviklere er å ha en mobil arbeidsstasjon i kombinasjon med en stasjonær arbeidsstasjon. De skriver kode og tester det iterative på den bærbare, og trener modellene på den kraftigere stasjonære. Da kan de jobbe her og nå og være produktive før de store datasettene kjøres i gang i stor skala på servernivå.

Sensitiv informasjon

Når man jobber med store mengder data, må man ofte forholde seg til sensitiv informasjon.

– Nesten alle bransjer jeg har snakket med – fra retail til forsvar – klassifiserer data i fire ulike sikkerhetskategorier, forteller Albert. Noe kan slippes ut i skyen, mens noe er så sensitivt at det ikke må forlate bedriftens lokaler.

– Ved å ha en kraftig stasjonær arbeidsstasjon som man kan koble seg opp mot fra hvor som helst via PC-over-IP-løsningen HP Anyware, slipper man å sende data ut av bedriften og inn i ulike kostbare skytjenester.

– Det er også GDPR-hensyn å ta, fortsetter Albert. Det er ikke all data man får lagre i skyen, eller sende over landegrenser. Hvis man samler bedriftens arbeidsstasjoner i et sikkert, låst datarom og lar de ansatte bruke HP Anyware til å koble seg opp, er skjermbildene det eneste som forlater datarommet, i form av krypterte piksler over en slags virtuell HDMI-kabel.

– Vi må kunne jobbe med data og være fleksible, men hender det noe, er det viktig at dataen er sikker, avslutter han.

Riktig programvare forhindrer skygge-IT

Men, datavitenskap-utviklere trenger ikke bare riktig hardware – de trenger riktig software også. 

– Vi ser at de fleste datavitenskapsutviklere ønsker å jobbe med operativsystemet Ubuntu – en variant av Linux. Der har vi en utfordring, da våre fleste kunders IT-avdelinger har et Windows-styrt miljø. Det fører til at utviklerne tar skjeen i egen hånd, og ender opp med å installere ting på maskinene sine selv, utenfor IT sin kontroll – såkalt «Shadow IT». De får ikke det de trenger fra IT, ingen spør dem hva de trenger, og må gjøre det beste ut av situasjonen når de får sine vanlige kontor-PC-er. Da ender de opp med å kjøpe dyre skytjenester for å i det hele tatt få gjort jobben sin. 

– I HP ønsker vi å gjøre det enkelt for alle å få verktøyene de trenger – så for å hjelpe de organisasjonene som ikke ønsker å måtte forholde seg til rene Ubuntu-installasjoner i maskinparken, jobber vi veldig mye med WSL2 – Windows Subsystem Linux versjon 2. Det er en Microsoft-løsning som muliggjør installasjonen av Ubuntu på en Windows-maskin. Da får IT-avdelingen beholde sin Windows-administrasjon, samtidig som utviklerne kan bruke alle Linux-applikasjonene de ønsker seg, uten tap av ytelse. Det beste av begge verdener, altså, sier Albert med et smil.

– Det tar også ofte opptil en uke for en datavitenskapsutvikler å få alt på plass når de får en ny datamaskin. Det er mye som skal installeres og konfigureres – så for å gjøre dette enklere, har vi i HP laget en Data Science Stack. Dette er en samling av de mest brukte linux-applikasjonene, korrekt installert og konfigurert opp mot hverandre fra fabrikk – enten levert med en ren Ubuntu-installasjon, eller med Windows 11 og Ubuntu via WSL2.

– Det er heller ikke sånn at eksisterende arbeidsstasjonsbrukere trenger å kjøpe en ny maskin for å få disse programmene. Z by HP Data Science Stack Manager kan lastes ned og installeres ved behov, så lenge virtualisering er tillatt i BIOS.

Snakk med din HP-partner

Albert mener det er viktig at utviklerne blir tilbudt riktig verktøy fra IT-avdelingen – og da må de finnes på bestillingslista. Hvis ikke, er det enklere for dem å bare finne frem kredittkortet og kjøpe dyr datakraft i skyen.

Snakk med din HP-partner for å få hjelp til å velge ut de riktige modellene for din utviklingsavdeling.