Dáta sú citlivá téma a ako dátový vedec sa s nimi budete prirodzene stretávať. Tu je niekoľko pravidiel, ktoré by ste mali vždy dodržiavať.
Dáta sú mimoriadne cenné a ich využitie je jednoducho jedným z najlepších postupov pre väčšinu dnešných organizácií. Ale poznať priemyselné štandardy týkajúce sa tohto je nevyhnutné, aby sa vedci údajov nemýlili s údajmi, keď sa ľudia dozvedia viac o ich hodnote.
Vedci údajov preto musia prijať bezpečné a etické postupy a prijať štandardizované. Namiesto uvažovania o tom, aké cenné sú len údaje, je rozumné spochybňovať spôsoby získavania a spracovania údajov na akýkoľvek účel. Tu je deväť kódexov správania, ktoré by mal dodržiavať každý dátový vedec.
1. Dodržujte predpisy
Vedci údajov musia poznať predpisy o ochrane údajov, ktoré sa vzťahujú na určité pracovné miesta. V opačnom prípade môžete nevedomky porušiť zákon a ohroziť seba aj ostatných. Takže tieto znalosti sú kľúčové pre zabezpečenie etickej práce a prevenciu neúmyselného poškodenia.
Pred začatím akejkoľvek činnosti si preto skontrolujte príslušné zákony. Okrem toho nedodržiavajte iba predpisy, aby ste dodržiavali pravidlá; snažiť sa o ich hlbšie pochopenie. Aby ste správne dodržiavali predpisy, musíte vedieť, prečo boli umiestnené a pred čím chránia.
Niekoľko pozoruhodných zákonov o ochrane osobných údajov je všeobecné nariadenie EÚ o ochrane údajov (GDPR) a kalifornského zákona o ochrane osobných údajov spotrebiteľov (CCPA). Medzi ďalšie patria HIIPA, DPA, PIPEDA, LGPD a mnohé priemyselné predpisy.
2. Rešpektujte súkromie
Adresy, e-maily a ID sú identifikátory, ktoré by nemali byť verejné, pretože pre ľudí predstavujú skutočné riziko. Dbajte preto na to, aby boli tieto podrobnosti čo najsúkromnejšie.
V prípade odhalenia by obete mohli trpieť krádežou identity alebo podvodom. Mohli by ich tiež vydierať ľudia, ktorí sa vyhrážali zverejnením ich dôverných informácií. Okrem toho môžu profesionáli utrpieť poškodenie dobrého mena a online obťažovanie po zverejnení ich osobných preferencií. Môžu ovplyvniť ich vzťahy, kariérne príležitosti a sociálne postavenie.
Takže s ohľadom na to skúmajte a vyberajte efektívne spôsoby, ako to urobiť lepšie bezpečné online identity a deidentifikovať údaje. Môžete napríklad nahradiť znaky, odstrániť priame identifikátory alebo zovšeobecniť. Týmto spôsobom ochránite citlivé údaje pred kyberzločincami a zároveň pomôžete organizáciám s vašimi zisteniami.
3. Odstrániť zaujatosť
Vedci údajov sa spoliehajú na to, že štatistiky budú čo najobjektívnejšie. Napriek tomuto úsiliu skreslenie pretrváva, pretože predstava, že väčšie údaje sú presnejšie, je jedným z bežné mýty o vede o údajoch.
Je na tom niečo pravdy, ale bohužiaľ, veľké údaje niekedy obsahujú zbytočné alebo falošné prvky a štatistiky. Namiesto toho, aby ste sa zamerali len na čísla, zaistite, aby boli vaše údaje čisté a reprezentatívne.
Čistenie alebo filtrovanie údajov pred použitím sú vynikajúce metódy boja proti zaujatosti. Môžete napríklad skontrolovať chyby alebo použiť stratifikované vzorkovanie na zabezpečenie reprezentatívnych údajov.
4. Nevymýšľajte ani nevymýšľajte výsledky
Výroba je forma nesprávneho správania údajov a podvodu pri výskume, ktorý zahŕňa vymýšľanie zistení a ich vykazovanie ako pravdivých.
Napríklad odborník na údaje môže oznámiť, že u väčšiny členov určitej vekovej skupiny sa zistilo, že liek nemá žiadne vedľajšie účinky. Tieto zistenia by boli vymyslené, ak by neexistovali žiadne počiatočné lekárske experimenty a zhromaždené údaje, ktoré by ich podporili.
Výroba má vážne a negatívne dôsledky pre vedcov údajov a tých, ktorí sa spoliehajú na ich prácu. Mohlo by to zničiť vašu dôveryhodnosť, poškodiť povesť vašej organizácie, poškodiť verejnosť alebo vás vystaviť právnym rizikám.
5. Nefalšujte a nemanipulujte s dôkazmi
Falšovanie je manipulácia s realitou, zozbierané údaje, aby vyhovovali agende. Zatiaľ čo výrobcovia vytvárajú výsledky z neexistujúcich údajov na podporu svojich tvrdení, falšovatelia pracujú na vyvrátení skutočných a existujúcich údajov z osobných dôvodov. Aby to dosiahli, môžu manipulovať s výskumným zariadením, meniť alebo úplne vynechať údaje.
Falšovanie môže poškodiť verejnosť poskytovaním nepravdivých informácií ovplyvňujúcich rozhodovanie v rôznych sektoroch. Falošná štúdia liekov by napríklad mohla vystaviť ľudí zbytočným rizikám, neúčinným liečebným postupom alebo škodlivým vedľajším účinkom. Môže to tiež spôsobiť stratu peňazí, času alebo materiálov, ktoré mohli byť použité na iné účely.
Výroba a falšovanie sú bezohľadné praktiky s nepriaznivými účinkami a početnými sankciami. Môžu zahŕňať pokuty, zrušenie poverení, stratu financovania výskumu alebo uväznenie.
6. Zobraziť priehľadnosť
Transparentnosť pre vedcov údajov znamená úprimnosť v súvislosti s metódami, ktoré sa používajú na zber, analýzu a prezentáciu údajov. Vedci údajov by mali byť otvorení a pripravení zdieľať svoje postupy s ostatnými vedcami údajov a účastníkmi štúdie.
Okrem toho musíte získať súhlas účastníkov štúdie, pretože publikovanie výsledkov bez informovaného súhlasu môže účastníkov rôznymi spôsobmi znevážiť alebo poškodiť. Môžu narušiť ich dôstojnosť, súkromie a autonómiu alebo ich vystaviť škodlivým, zbytočným rizikám vyplývajúcim zo štúdie.
Transparentnosť buduje dôveru u tých, ktorí sa spoliehajú na vaše údaje. Zabezpečuje tiež kvalitu údajov tým, že umožňuje ostatným kontrolovať vaše výsledky.
Okrem toho otvorenosť medzi vedcami údajov podporuje spoluprácu a učenie. Môžete pomôcť podporiť inováciu zdieľaním svojho procesu a komunikovaním o ňom najlepšie metódy vizualizácie údajov a techniky dátovej vedy rovesníkom a zároveň sa od nich učiť.
7. Zbierajte údaje bezpečne
Vedci údajov musia potvrdiť bezpečnosť metód používaných na zhromažďovanie, analýzu a uchovávanie údajov. Tým sa zabráni potenciálnemu narušeniu údajov, ktoré môže ovplyvniť vedcov údajov a účastníkov štúdie.
Porušenia údajov ohrozujú osobnú bezpečnosť, podkopávajú dôveru verejnosti a odhaľujú organizačnú nekompetentnosť, čo má za následok obrovské finančné straty spoločnosti. Týmito stratami môžu byť súdne spory od obetí narušenia údajov, menej klientov a ďalšie.
Vo svetle toho musíte vykonať prieskum, aby ste našli najefektívnejšie riešenia zabezpečenia dát a aplikovať ich. Môžete napríklad zabezpečiť pripojenia pomocou šifrovania TLS/SSL alebo použiť rotujúce servery proxy. Môžete tiež vynútiť opatrenia na kontrolu prístupu a vytvoriť zálohy v prípade útoku. Keď nájdete riešenia, nezabudnite ich zdieľať s ostatnými, aby ste zaistili maximálnu bezpečnosť.
8. Používajte algoritmy zodpovedne
Algoritmy nie sú len nástrojmi na analýzu údajov. Majú silný vplyv na životy, správanie a príležitosti ľudí. Napriek tomu, že pomáhajú riešiť problémy a robia inovatívne predpovede, sú zároveň nedokonalé.
Ak algoritmy nie sú starostlivo navrhnuté, testované alebo nasadené, majú sociálne a etické dopady, ktoré môžu poškodiť určité skupiny ľudí. Zavádzajú tiež zaujatosť, ak sú trénované na údajoch, ktoré odrážajú existujúce predsudky a môžu byť nepredvídateľné. Vedci údajov ich preto musia navrhovať a používať zodpovedne.
Vždy vyberte vhodné algoritmy, otestujte ich výkon a vysvetlite, ako fungujú. Tiež sa uistite, že identifikujete potenciálne zdroje zaujatosti a implementujete mechanizmy, ktoré v prípade potreby aktualizujú alebo opravujú.
9. Zvážte dlhodobé dôsledky svojej práce
Vaša práca dátového vedca výrazne ovplyvní mnohé aspekty spoločnosti. Takže vždy zvážte, ako vaše modely ovplyvňujú ľudí.
Skúste si napríklad položiť otázku, či vaša práca môže v budúcnosti udržiavať predsudky a nerovnosť alebo ohrozovať súkromie. Ďalej tieto obavy primerane riešte.
Všimnite si, že výhľad orientovaný na budúcnosť je dôležitejší ako akákoľvek korektívna metóda a premýšľanie o nasledujúcich dňoch je jedným z najefektívnejších spôsobov, ako robiť eticky správne rozhodnutia.
Ako dátový vedec musíte byť etický
Ako dátový vedec získate právomoc, ktorá prichádza s proporcionálnou zodpovednosťou. Vaše schopnosti sú vzácne, takže sedíte v popredí organizačného rozhodovania.
Vaše rozhodnutia ovplyvňujú všetko od obchodných plánov spoločnosti až po systémy trestného súdnictva. Nemali by ste ich teda robiť na ľahkú váhu. Vo svojej práci buďte vždy čestní, etickí a dôslední, aby ste ochránili ľudí pred existujúcimi etickými dilemami vo vašom odvetví a iných technologických oblastiach.