Bygger dataplattform i petabyte-skala

PGS girer opp digitalisering ved å flytte sitt enorme bibliotek av seismiske data til skyen. Sammen med skyeksperter fra Computas utvikler de grunnlaget for en sikker og robust digital markedsplass for seismikkdata.

PGS tilbyr geofysiske tjenester for å støtte leting og produksjon av energiressurser offshore. I 30 år har PGS samlet inn data fra havbunnen ved å bruke spesialbygde fartøyer som tauer seismiske lyttekabler. Kablene som er fullpakket med hydrofoner og geofoner, plukker opp lydbølger som har blitt reflektert nede i havbunnen, på sammen måte som i en ultralydundersøkelse. Ved å behandle flere hundre gigabyte med feltdata hver undersøkelse kan gi, produserer PGS 3D-bilder og data som beskriver strukturer og reservoarer, som de selger til det globale markedet av energiselskaper.

Med titalls petabyte med data samlet over tre tiår lagret i flere databaser og formater, møter PGS naturligvis utfordringer med varierende datakvalitet og standardisering når de prøver å flytte dataene til skyen. PGS og Computas utvikler nå en dataplattform på en sikker, skalerbar og robust måte med et spesielt hensyn til datakvalitet, basert på Google Cloud Platform. Denne frigjøringen av dataen fra tape vil åpne for nye kommersielle og tekniske løsninger.

Enklere for både PGS og kunden

– PGS bygger en digital markedsplass for seismiske data. Vi har som mål å effektivisere og kvitte oss med manuelle prosesser, slik at vi kan presentere seismiske data sømløst i vårt digitale utstillingsrom, og å tilby kundene våre rask, sikker og 24/7 tilgang til dataene de har lisensiert. Dette krever nye digitale løsninger, men også en endring i vår kultur og måte å jobbe på. Det er en reise, både teknisk og organisatorisk, å få til dette, sier Espen Grimstad, Prosjektleder Digitalisering i PGS.

PGS samarbeider med det norske IT-selskapet Computas, som er Google Cloud Premier Partner og har lang erfaring med digitalisering av selskaper innen blant annet energi.

– Når det gjelder teknologi og omfang av datainnsamling, av nettverk, signalbehandling og 3D-bildebehandling, er seismikk- og energisektoren høyteknologisk. På noen områder, som bruk av skyplattformer, ser vi et stort potensial, men er vi avhengige av partnere for å gjøre skyreisen vellykket. Computas har både ekspertisen på Google Cloud Platform og den nødvendige erfaringen for å gi oss verdifulle råd, sier Grimstad.

En markedsplass for olje- og gassindustrien

På grunn av det enorme omfanget av data var lagring og levering av data på fysiske medier, som taper og disker, inntil nylig normen i seismikkindustrien, inkludert hos PGS. Håndteringen av de fysiske mediene kan føre til at et salg kan ta måneder å gjennomføre, og medføre mye reising både frem og tilbake. Takket være digitalisering og automatisering av verdikjeden, kan den skybaserte plattformen som for tiden er under bygging, levere relevante data til kundene på en brøkdel av et sekund og dermed spare tid og redusere kostnader og karbonavtrykket ved et salg.

– Tradisjonelt ville kunden kjøpt en lisens, og så fikk de seismikkdataene levert på fysiske medier. Nå er det mulig å tilby nye forretningsmodeller, som data abonnement, og å tilby dataene direkte til kunden, slik at de får tilgang til sine interesseområder på sin egen datamaskin, forklarer Espen Grimstad.

– Med PGS-data i skyen trenger vi ikke lengre å sende data på tape til kunden. Uten fysisk håndtering av dataene, kan kundene få øyeblikkelig og 24/7-tilgang, slik at de kan respondere på muligheter raskere og utvikle nye løsninger. Å ha Computas sin sky- og dataplattformekspertise i teamet er uvurderlig for PGS i denne prosessen. Computas hjelper oss på mange måter med å skape denne markedsplassen. De hjelper oss med å lage en moderne skyarkitektur som de også implementerer, samtidig som de utfordrer eksisterende prosesser og løsninger og er gode rådgivere, sier Grimstad.

Erik Ewig, Senior VP Technology & Digitalization i PGS, deler Grimstads erfaring. 

– Computas og deres konsulenters kompetanse, kunnskap og positive holdning har vært en avgjørende faktor for at PGS har nådd målet om å gjøre våre massive datasett digitalt tilgjengelige for våre kunder. Vi vil fortsette vårt nære forhold til Computas som partner i vår digitale transformasjon fremover, sier Ewig.

Big Data

Anders Elton er seniorrådgiver for Data and Insight i Computas, og er en av skyekspertene som jobber med PGS.

– Du trenger mye data- og lagringsressurser for å håndtere Big Data, og å gjøre dette på en kostnadseffektiv måte er krevende, forklarer han.

– Det er tusenvis av seismiske filer og petabyte med data med varierende metadata-kvalitet. For eksempel, hvis de seismiske metadataene ikke samsvarer med koordinatsystemet som faktisk brukes i kartprojeksjonen av de seismiske dataene, er dataene av liten verdi for kunden. Tenk deg å se på Oslo i Google maps, hvor alle gatenavnene er norske, mens selve tegningene av gatene er fra Stockholm – du får åpenbart problemer med å finne det du leter etter! Heldigvis har PGS og deres digitaliseringsprosjekt datakvalitet som hovedfokus, og vi bruker hele verktøykassen til Google Cloud Platform for å gjøre dette på en god måte, fortsetter Elton.

– Data vil ikke nå sluttbrukeren før de har gått gjennom flere sjekkpunkter – og vi bygger automasjon for å rette opp svakheter som avdekkes. Vi bruker BigQuery som en sentral integrasjonshub for metadata slik at vi kan se på alle de ulike databasene kombinert på måter vi ikke har gjort før, sier han.

Moderne teknologi-stack

Prosjektet utnytter de nyeste teknologiene som skyen tilbyr. Serverless og skalerbare pipelines – både Dataflow og Cloud Run, moderne CI/CD ved bruk av Gitlab, og selvfølgelig en fullt skriptet infrastruktur med Terraform.

Cognite Data Fusion (CDF) er en nøkkelkomponent i tolkningen av seismiske data. Den håndterer de seismiske dataen i cloud storage og gjør det tilgjengelig i et moderne API for klienter å bruke, samtidig håndheves som tilgangspolicyer.

– Å ha en plattform som CDF, som korrekt kontekstualiserer seismiske data, åpner for nye muligheter, og lar deg gjøre datanære analyser i skyen, sier Elton.

Prosjektet innebærer også løsninger som presenterer seismikk og metadata lesbart for kunden, ved å bruke ulike visualiseringsverktøy som Google Data Studio og Microsoft Power BI. I tillegg har de utviklet en skreddersydd applikasjon for å visualisere innsikt der standardløsninger kommer til kort.

– Jeg liker veldig godt å jobbe med PGS. De er åpne for å prøve all ny teknologi for å nå målet om en fullstendig digitalisert og liberalisert dataplattform. PGS har en blanding av greenfield og eldre programvare som gjør det både utfordrende og morsomt for oss i Computas å jobbe med dette oppdraget, sier Anders Elton.

Teknologien vi brukte:

  • Terraform
  • Gitlab
  • Cognite Data Fusion
  • SQL Server
  • Phyton
  • Google Data Studio
  • Microsoft PowerBI
  • GCP StackBigQueryDataflow
    • Dataform
    • Cloud Run
    • Cloud Functions
    • Cloud Scheduler
    • Cloud Workflows
    • Cloud Storage
    • Cloud Alerting
    • Cloud VPC (Virtual Private Cloud)
    • Pub/Sub
    • Identity Aware Proxy

x

Vil du vite mer?

Kontakt oss gjerne på e-post for en uforpliktende prat.

Sigrid Ekremsvik Dragset