AWS-polkuAWS Kickstart - AWS Polku
AWS Kickstart
AWS Go Live - AWS Polku
AWS Go Live
AWS Data and AI Boost - AWS Polku
AWS Data & AI Boost
AWS Cloud Native Transformation - AWS Polku
AWS Cloud Native Transformation
AWS Future-Ready - AWS Polku
AWS Future-Ready
AWS PilvipalvelutAWS integraatiot - AWS Integration Platform
AWS Integraatioalusta
AWS konsultointi ja ylläpito - Skillwell Cloud Operations Service
AWS Konsultointi ja Ylläpito
Skillwell Well Architected Review
AWS Well Architected Arvio
SaaS palvelukehitys - SaaS Development Service
SaaS Palvelukehitys
Tekoäly- ja asiakaspalveluratkaisutSkillwell Generative Ai - Generative Ai
Generatiivinen Tekoäly
Skillwell Amazon Connect
Amazon Connect
Skillwell Smart Customer Service
Älykäs Asiakaspalvelu
CONTROL PLANEUniversal SaaS Control Plane
Universal SaaS Control Plane
KALUSTONHALLINTAFleet management
PEKAS
VideoratkaisutVideoratkaisut - Skillwell LIVEL Services
LIVEL Services
Ajankohtaista
Referenssit
Blogi
Tietoa meistä
Ota yhteyttä

Kesäharjoittelu Skillwellillä – Uusia Oivalluksia Ohjelmoinnista ja AWS:stä

Hei, täällä kirjoittelee 21-vuotias alunperin jyväskyläläinen mutta sittemmin Helsinkiin muuttanut opiskelija, joka on viettänyt nyt tämän kesän harjoittelijan roolissa Skillwellillä. Aloitan nyt syksyllä toisen vuoden opinnot Aalto-yliopistossa bioinformaatioteknologian parissa. Opinnoissa pääsen pääosin yhdistelemään matematiikkaa, fysiikkaa ja ohjelmointia erilaisten biologisten sekä lääketieteeseen liittyvien ongelmien parissa. Vaikka näistä ohjelmointi on ollut itselleni lähes täysin uusi tuttavuus, siitä huolimatta se on innostanut itseäni jopa eniten omissa opinnoissani. Ennen koulun aloitusta kokemukseni ohjelmoinnista oli pyöreä nolla, minkä takia onkin ollut mahtavaa löytää täysin uusi asia, mistä innostua ja kiinnostua. Tämä onkin yksi syy, miksi halusin kesällä pyrkiä työskentelemään samojen asioiden parissa ja minkä takia päädyin nyt kesäksi harjoitteluun Skillwellille.

Kun aloitin kesäkuussa harjoitteluni Skillwellillä, tietoni AWS:tä ja sen tarjoamista palveluista olivat melkeinpä olemattomat. Tämän takia ensimmäinen tavoitteeni olikin saada jonkinlainen ymmärrys AWS:tä ja siitä, miten sitä pystytään hyödyntämään. Aloitin siis kesätyöni tutustumalla AWS:n tarjoamiin palveluihin sekä selvittämällä ylipäätänsä, mitä AWS tekee ja miksi. Käytinkin ensimmäiset pari viikkoa siihen, että kävin läpi AWS:n Certified Cloud Practitioner- kurssia valmistautuen Certified Cloud Practitioner -kokeeseen, jotta saisin ymmärrykseni riittävälle tasolle toimiakseni AWS:n tarjoamassa ympäristössä. 

AWS ja Pilvipalveluiden Perusteet – Sertifioinnista Oivalluksiin

Koska tietoni alussa aiheeseen liittyen olivat suhteellisen olemattomat, oli joka päivä aina jotain uutta opittavaa. Vaikka uuden oppiminen oli innostavaa ja aihekin oli hyvin mielenkiintoinen, oli uusien asioiden jatkuva omaksuminen kieltämättä välillä myös hieman vaikeaa, kun tuntui, että uutta tietoa oli loputtomasti tarjolla. Kuitenkin samalla oli palkitsevaa, kun huomasi että oma ymmärrys karttui ja se toikin aina huomattavasti lisää motivaatiota opiskeluun. Myös se, että opiskeli asioita kurssin avulla, toi rakennetta omaan oppimisprosessiin ja helpotti myös opiskelun rytmittämistä, kun ei itse tarvinnut pohtia, mitkä asiat ovat olennaisia ja mitkä taas eivät ole. Myönnettäköön kuitenkin, että varsinkin alussa ajatus sertifikaattikokeesta tuntui jännittävältä ja mietin monesti, että en koskaan saa riittävää ymmärrystä, että pääsisin siitä läpi. Kuitenkin pikkuhiljaa luottamus omiin tietoihin nousi ja uskalsin jopa varata kokeen itselleni. Jännityksestä huolimatta koe meni lopulta ihan hyvin ja pääsin läpi, vaikka koetta tehdessä en ollutkaan siitä ihan niin varma.

Sertifikaatin suorittamisen jälkeen seuraava tavoitteeni oli tutustua AWS:n HealthOmics-palveluun, jonka tarkoituksena on helpottaa niin sanotun omisen datan varastointia, jakamista ja analysointia. Ominen data on nimensä mukaan saatu erilaisista organismien “omeista”, joita ovat esimerkkiksi genomi, transkriptomi ja proteomii. Palvelu on tarkoitettu erityisesti terveysalan yrityksille, joiden täytyy hallinnoida ja varastoida laajoja määriä omista dataa sekä tuottaa tarkkoja analyysejä kyseisestä datasta. HealthOmics valikoitui tutustumisen kohteeksi, koska palvelu liittyy hyvin vahvasti bioinformatiikan alaan ja koin, että pystyisin sekä tulevaisuudessa hyödyntämään nyt opittuja taitoja että hyödyntämään jo oppimiani tietoja palveluun tutustuessa. 

HealthOmics Tutuksi – Pilvipalvelu Genomidatan Varastointiin ja Analysointiin

Tavoitteenani oli saada ymmärrystä siitä, miten HealthOmics toimii sekä siitä, mitä kaikkea palvelulla oikein pystytään tekemään. Erityisesti pyrin keskittymään siihen, mihin kaikkiin tarkoituksiin palvelua voidaan hyödyntää bioinformatiikan alalla ja miten esimerkiksi itse pystyisin tulevaisuudessa hyödyntämään palvelua sekä opinnoissa että työelämässä. Yksi tärkein kysymys mihin pyrin löytämään vastauksen oli se, miten terveysalan yritykset pystyvät tuottamaan lisäarvoa omille bioinformatiikan prosesseille käyttämällä hyväksi HealthOmicsia esimerkiksi tallennuspalveluna tai osana genomisen datan analysointia. Tähän tärkeänä osana oli ymmärtää, se miten muita AWS:n palveluita voidaan käyttää hyväksi yhdessä HealthOmics palvelun kanssa esimerkiksi luoden automatisoituja bioinformatiikan prosesseja hyödyntäen AWS Lambdaa sekä EventBridgeä. 

Palveluun tutustumisen lisäksi toisena tavoitteena oli toteuttaa oma projekti liittyen genomisen datan analysointiin käyttämällä HealthOmicsia. Kun oma ymmärrykseni palvelusta sekä sen toiminnasta alkoi pikkuhiljaa vahvistumaan, aloitin oman projektin valmistelun. Projekti alkoi ensin sen suunnittelulla ja aiheen valinnalla. Pian päätinkin, että aiheena olisi tutkia eroja syöpäkudoksen ja terveen kudoksen välillä. Tavoitteena oli löytää sekvenssidatasta samoja somaattisia mutaatioita eri keuhkosyöpäpotilaiden välillä, joiden avulla pystyisi tutkimaan, mitkä mutaatiot voivat olla mahdollisesti vastuussa syövän kehittymisestä. Somaattisilla mutaatioilla tarkoitetaan siis mutaatioita, joita ihminen ei ole perinyt vaan ne ovat tapahtuneet tietyssä solussa vasta jossain kohtaa sikiön kehitystä tai sen jälkeen. Perityt mutaatiot ovat löydettävissä jokaisesta solusta, kun taas somaattiset solut ovat esillä vain siinä solussa, missä mutaatio on tapahtunut. Tämän takia somaattiset mutaatiot pystytäänkin löytämään vertailemalla eri soluista saatua sekvenssidataa. 

Käytin projektissa hyväksi NCBI:n geenipankkia, josta löytyy hyvin laajasti niin sanottua SRA-dataa, josta voidaan analysoida potilaalta löytyviä geenivariaatioita. Tämän datan sain tallennettua HealthOmicsiin, josta pystyin sitten muokkaamaan sitä helpommin analysoitavampaan muotoon HealthOmicsin eri työkalujen avulla. Käytin muun muassa palvelun tarjoamia käyttövalmiita Ready2Run-työnkulkuja, joilla pystyin analysoimaan palveluun tallentamaani dataa luoden tiedoston, josta löytyi kaikki datasta löytyneet somaattiset mutaatiot.

Muita AWS-palveluja Työn Tukena – Amazon Athena ja Lake Formation

Hyödynsin projektissani HealthOmicsin lisäksi myös muita AWS:n palveluja kuten Amazon Athenaa ja Lake Formationia, minkä seurauksena opin paljon lisää myös näistä palveluista. Athenan avulla pystyin vielä tarkemmin tutkimaan työnkulkujen lopputuloksena saatuja VCF-tiedostoja, kun taas Lake Formationin avulla hallinnoin sitä, kuka pääsee käsiksi näihin tiedostoihin. Varsinkin Athenan käyttäminen oli hyvin opettavaista, sillä en koskaan aikaisemmin ollut käyttänyt SQL:ää, mutta Athenaa käyttäessä pääsin opettelemaan sen toimintaa, mikä oli taas hyvin mielenkiintoista. Uskon, että SQL:än opettelu oli erittäin hyödyllistä ja sitä pääsenkin varmasti hyödyntämään jo opintojeni aikana. 

Aluksi projektissa aikaa kului perustietojen kartoittamiseen kuten genomidatalle ominaisiin tiedostotyyppeihin tutustumiseen. Tämän lisäksi aikaa kului sopivan datan etsimiseen geenipankeista ja sen muokkaamiseen oikeaan muotoon. Vaikka geenidataa onkin paljon tarjolla eri geenipankeissa, juuri oikeanlaisen datan löytäminen aiheutti aluksi hieman haasteita, sillä projektia varten tuli löytää samalta ihmiseltä sekä niin sanottua normaalia geenidataa että kasvaimesta saatua geenidataa. Alussa myös AWS-konsolin käyttäminen hieman jännitti, kun aikaisempaa kokemusta ei ollut ja pelotti, että tekee jotain peruuttamattomia virheitä. Kuitenkin tämä pelko oli turha, sillä itse ympäristö oli hyvin helppokäyttöinen eikä se aiheuttanut ongelmia. Netistä löytyi myös paljon tietoa HealthOmicsista, mikä helpotti huomattavasti. Projektin edetessä pääsin yhdistelemäänkin monia eri AWS:n eri palveluita analysoidessa dataa, aina S3:sta Athenaan sekä hyödyntämään HealthOmicsin eri ominaisuuksia tallennuspalveluista datan analysointiin. Koen, että projektin tekeminen antoi itselleni huomattavasti lisää ymmärrystä ja tietoa, kun pääsin oikeasti soveltamaan opiskelemiani asioita käytännössä. 

Mitä Seuraavaksi?

Tässä blogissa oli nyt hieman omia kokemuksiani kesän ajalta AWS:n eri palveluiden parissa. Parin viikon sisään ilmestyvässä blogissa tulenkin sitten käymään hieman tarkemmin läpi itse HealthOmicsia sekä sen eri ominaisuuksia. Siinä tullaan myös paneutumaan hieman tarkemmin HealthOmicsin käyttötarkoituksiin sekä sen mahdollisiin soveltamiskohteisiin.

Skillwell on 2018 perustettu timanttinen tiimi Jyväskylästä. Asiantuntijoillamme on vahvaa osaamista digitaalisista palveluista, AWS-pilvipalveluista ja integraatioratkaisuista. Yritykset tuntevat meidät luotettavana ja ajassa mukana olevana IT-kumppanina.

skillwell suomen vahvimmat platina

Kauppakatu 39

40100 Jyväskylä

© Skillwell Oy 2024

Hei! Haluaisitko keskustella tilanteestasi ilmaisessa palaverissa?

skillwell icon