Ochrana dat












            ******************************************************************************************

            *
            ******************************************************************************************


            Umělá inteligence mění způsob, jakým pracujeme, komunikujeme i vyhledáváme informace. Nást
            AI, jako jsou chatboti nebo systémy pro tvorbu textu a obrázků, přinášejí ohromné možnosti
            tehdy, pokud s nimi zacházíme obezřetně.


            Modely generativní AI mohou být trénovány mimo jiné na datech, která do nich vkládají jeji
            Proto nejsou zpravidla navrženy tak, aby zajišťovaly jejich důvěrnost nebo chránily inform

            chatboty a jinými nástroji sdíleny.
            Myslete na to, že většina běžně dostupných chatbotů používá data, která do AI nástrojů vkl

            trénování modelů umělé inteligence. Tato data zároveň opouští vaše zařízení a zpracovávají
            provozovatele.












            Do běžně dostupných chatbotů proto nevkládejte citlivá data, osobní údaje nebo interní dat


            Tato chráněná a interní data můžete vkládat pouze do nástroje Microsoft Copilot pod univer
            nebo ve specifických případech do lokálně provozovaných modelů.


            Chráněná, interní a veřejná data [ URL "https://openscience.cuni.cz/OSCI-95.html"]











            ******************************************************************************************
            * Proč je třeba myslet na ochranu dat?

            ******************************************************************************************



            Z hlediska právní i etické odpovědnosti je nutné mít na paměti, že některá data podléhají 
            – zejména osobní a citlivé údaje podle legislativy (např. GDPR) by neměly být vkládány do 
            generativní AI.


            Chatboti obvykle fungují jako cloudové služby, což znamená, že zadávané informace opouští 
            uživatele a zpracovávají se na serverech provozovatele. Vkládání jakýchkoliv osobních údaj

            adresa, hlasová nahrávka nebo IP adresa) – do těchto systémů bez výslovného souhlasu dotče
            rozporu s GDPR.


            Nejde jen o přímé vkládání dat do chatbotu, ale o jakoukoli formu zpřístupnění dat AI nást
            nástroji umožníme přístup k citlivým datům, je to z pohledu rizika v zásadě stejné, jako b
            přímo vložili do chatu.



            Udělování širokých oprávnění AI nástrojům (přístup k diskům, mailům, repozitářům)

            je velmi rizikové a nedoporučované.



            Většina veřejně dostupných chatbotů a nástrojů generativní AI navíc standardně používá vlo
            další trénování modelu. To představuje významné riziko nejen z pohledu ochrany osobních úd
            práci s informacemi chráněnými autorským právem, obchodním tajemstvím či smluvní mlčenlivo


            Pokud například do nástroje vložíme část textu z neveřejného výzkumu, studentské práce neb
            materiálu, systém si tyto informace může „zapamatovat“ a jejich fragmenty se mohou později

            výstupech poskytovaných jiným uživatelům. Navíc k těmto datům získává přístup samotný posk
            nástroje, který je může bez vašeho vědomí dále využívat.


            Tím může dojít nejen k narušení důvěrnosti ke vkládaným datům, ale i k nechtěnému úniku ch
            obsahu. Proto je nezbytné pečlivě zvažovat, co do AI systémů vkládáme, a kdykoli je to mož
            anonymizovanými či veřejně dostupnými zdroji.









            I v případě, kdy provozovatel AI nástroje nepoužívá data pro trénování nebo jiné vlastní ú
            hrozí riziko ztráty dat či jejich zneužití v důsledku bezpečnostního incidentu (např. útok
            chyby v konfiguraci, úniku záloh). Infrastruktura pro fungování AI nástrojů je zpravidla v

            zahrnuje mnoho subdodavatelů, díky čemuž významně roste i riziko takového úniku.

            Při sdílení dat s AI nástroji musíme tedy vždy předpokládat, že k jejich úniku dojít může.

            důležité dobře zvážit, zda je pro nás takové riziko přijatelné.







            Co jsou to chráněná data?
            Osobní údaje
            Jakákoliv informace, která umožňuje přímo či nepřímo ztotožnit konkrétní fyzickou osobu, j

            osobní údaj podle obecného nařízení o ochraně osobních údajů (GDPR) a zákona č. 110/2019 S
            osobních údajů.


            V rámci studia mohou často studující pracovat s osobními údaji v souvislosti s dotazníkový
            rozhovory, nahrávkami či při práci se zdravotnickou dokumentací. Kromě typických příkladů 
            jako jsou identifikační údaje člověka (např. rodná čísla/jiná identifikační čísla u cizinc

            příjmení, datum narození, adresa), to mohou být i údaje, u kterých to na první pohled nemu
            zjevné, např. nahrávka hlasu, rentgenový snímek nebo IP adresa.










            Materiály obsahující osobní údaje je možné před vložením do nástroje generativní AI anonym
            přeformulovat. V praxi to znamená například vymazání jmen, jakýchkoliv identifikačních čís






            Zvlášť chráněnou kategorii pak představují tzv. zvláštní kategorie osobních údajů, mezi kt
            řazeny informace vypovídající o rasovém či etnickém původu, politických názorech, nábožens
            filozofickém přesvědčení nebo členství v odborech, genetické a biometrické údaje a údaje o

            či o sexuálním životě nebo sexuální orientaci.

            Základní pravidlo tedy zní, že uživatelé v zásadě nesmí do chatbotů a dalších nástrojů AI 

            údaje, pokud k tomu nemají výslovný souhlas od osob, ke kterým se osobní údaje vztahují. H
            zásahu do soukromého života osob, ale také možné zneužití osobních údajů ze strany poskyto
            Současně se také jedná o zpracování osobních údajů, které musí být v souladu s nařízením G











            Některé externí nástroje generativní AI – zejména v placených verzích – nabízejí uživatelů

            využití zadaných dat pro další trénování modelu. Ačkoli tuto funkci doporučujeme vždy akti
            dostupná, je potřeba si uvědomit, že i v takovém případě data opouštějí počítač uživatele 
            na serverech poskytovatele dané služby.


            Z tohoto důvodu nedoporučujeme vkládat citlivé informace nebo osobní údaje ani do chabotů,
            trénování vypnuto, pokud není ochrana dat ošetřena smluvně.









            Data chráněná autorským zákonem
            Data, která jsou jedinečným výsledkem tvůrčí činnosti fyzické osoby (tedy člověka, nikoli 

            nebo nástroje generativní AI), jsou chráněna autorským právem jako autorská díla podle zák
            Sb. (autorský zákon). Autorských děl může vznikat široká škála; může jít například o dílo 
            fotografické, výtvarné nebo kartografické. Autorským právem je chráněn i software, resp. j


            Je třeba mít na paměti, že již samotné vložení autorského díla do nástroje generativní AI 
            autorského díla. K takovému užití díla musíme mít licenci (oprávnění od autora či držitele

            práv), nebo nám musí svědčit některá z výjimek autorského zákona, např. volné užití díla p
            potřebu. Mimo to je však nutné také věnovat pozornost podmínkám užití daného nástroje AI v
            skutečnosti, zdali se nástroj generativní AI trénuje na uživatelských promptech.


            V případě výstupů generativní AI si uživatelé musí dát pozor na to, že výstupy mohou obsah
            autorských děl třetích osob, jejichž zveřejnění prostřednictvím akademických výstupů by mo

            užití díla, ke kterému je potřeba získat od autora licenci. To platí také pro situace, kdy
            využití nástrojů generativní AI k úpravě díla, například obrázku, neboť dochází ke vzniku 
            díla.


            V případě, že pak dochází k užití díla bez licence a současně takovému užití nesvědčí žádn
            autorského zákona (např. citační licence), tak se jedná o zásah do práv autora původního d

            autorovi následně vzniká právo domáhat se odstranění následků a poskytnutí přiměřeného zad
            způsobenou újmu.



            Jiná citlivá data
            V případě, že při tvorbě akademických výstupů na univerzitě má studující vztah k nějakému 

            pracovněprávní vztah k?obchodní společnosti či státní instituci) a dochází k využití dat t
            tak je také nutné myslet na to, že tato data mohou být pro tento subjekt velmi cenná.


            Typicky by mohlo jít o data, na která se vztahuje povinnost mlčenlivosti upravená ve smlou
            smlouvě, dohodě o práci konané mimo pracovní poměr, ve smlouvě o spolupráci apod.), data p
            obchodní tajemství nebo data mající povahu utajované informace dle zákona č. 412/2005 Sb.,

            utajovaných informací a o bezpečnostní způsobilosti.

            Vložením takových dat do nástrojů generativní AI by mohlo dojít k jejich vyzrazení, což by

            pro subjekt závažné důsledky. Proto v případě, kdy používáme taková data, je vždy v první 
            konzultovat zpracování dat prostřednictvím nástrojů generativní AI s tímto subjektem.



            Microsoft Copilot
            Microsoft Copilot je nástroj umělé inteligence, který je v podobě webového chatbota dostup

            studujícím a zaměstnancům UK.

            Přihlášení uživatelé Microsoft Copilot mají několik výhod. Jde o přístup k výkonějšímu mod

            delších konverzací.

            Zásadní výhoda však spočívá ve zvýšené ochraně dat. Když se přihlásíte pomocí studentského

            zaměstnaneckého účtu, Copilot poskytuje komerční ochranu dat  [ URL "https://learn.microso
            copilot/microsoft-365/microsoft-365-copilot-privacy"] - to znamená, že vaše data jsou lépe
            chráněna.


            Jako každý nástroj, ani MS Copilot nelze považovat za stoprocentně bezpečný. Možnosti kont
            se s daty v celé infrastruktuře skutečně děje, jsou velmi omezené a i tato infrastruktura 

            a data odcizena. Na rozdíl od běžně a zdarma dostupných chatbotů u MS Copilotu ovšem ochra
            data jsou smluvně chráněna.








            Zvýšená ochrana dat se vztahuje pouze na verzi Copilotu používanou pod univerzitním účtem.

            zaměňovat s běžnou veřejně dostupnou verzí Copilotu, která je zdarma. Do MS Copilot Chatu 
            přihlašujte univerzitním účtem.



            Přihlaste se zde. [ URL "http://copilot.microsoft.com/"]


            Jak se přihlásit a více informací najdete zde. [ URL "https://ai.cuni.cz/AI-70.html"]



            Lokální modely

            Lokální modely generativní AI jsou modely, které běží přímo na zařízení uživatele – napřík

            osobním počítači nebo na zabezpečeném serveru dané instituce – a nekomunikují s externími 
            službami. Díky tomu nedochází k odesílání ani ukládání dat mimo prostředí uživatele, což v
            riziko úniku nebo zneužití informací.


            Právě z tohoto důvodu lze do těchto modelů, při dodržení odpovídajících bezpečnostních opa
            i citlivá nebo interní data (např. výsledky výzkumu, studentské práce nebo osobní údaje), 

            dostupných online nástrojů zpravidla nežádoucí či nepřípustné.








            Vyhodnocení, zda je prostředí, ve kterém je provozován lokální model, skutečně bezpečné, v
            znalosti. Doporučeno tak je používat jen takové lokální modely a prostředí, které jsou ofi

            a schváleny. 







            Pět zásad práce s nástroji AI







            Do běžných chatbotů nevkládajte osobní, citlivá, interní nebo jinak chráněná data.

            Vyhnete se tím riziku, že vaše data budou použita na trénování dalších modelů anebo že doj

            zneužití vašich dat.












            Používejte nástroje Generativní AI doporučené univerzitou nebo fakultou.


            Tyto nástroje mají ochranu dat smluvně ošetřenou.











            Když to jde, anonymizujte svá data.

            Při práci s jakýmkoliv chatbotem je nejbezpečnější data, která do nich vkládáte, anonymizo

            znamená například smazat jména, osobní čísla, adresy.











            Sdílejte s AI nástroji vždy jen nezbytné minimum dat pro daný úkol.


            Je rozdíl svěřit nástroji jeden konkrétní soubor a nebo mu otevřít přístup k celému disku 












            Nesvěřujte AI nástrojům vysoce citlivá data, u kterých si v žádném případě nemůžete dovoli
            únik nebo zneužití.


            Žádný AI nástroj není zcela bez rizika.







            Teď, když znáte základní zásady ochrany dat, se můžete směle pustit do promptování a exper
            umělou inteligencí.


            Univerzita Karlova podporuje využívání nástrojů generativní umělé inteligence studujícími 
            že je využití AI transparentní a v souladu s právním řádem ČR, předpisy Univerzity Karlovy

            součástí.

            Podívejte se na nástroje dostupné na univerzitě, přečtěte si první rady o promptování nebo

            pokud máte další otázky.



            Nástroje doporučené univerzitou [ URL "https://ai.cuni.cz/AI-9.html"] Rychlý start v promp
            "https://ai.cuni.cz/AI-79.html"]


            Doporučení vedení Univerzity Karlovy k bezpečnému užívání nástrojů generativní umělé intel
            "https://ai.cuni.cz/AI-68.html"]


            Kontaktujte nás [ URL "mailto:ai@cuni.cz"]