Ochrana dat ****************************************************************************************** * ****************************************************************************************** Umělá inteligence mění způsob, jakým pracujeme, komunikujeme i vyhledáváme informace. Nást AI, jako jsou chatboti nebo systémy pro tvorbu textu a obrázků, přinášejí ohromné možnosti tehdy, pokud s nimi zacházíme obezřetně. Modely generativní AI mohou být trénovány mimo jiné na datech, která do nich vkládají jeji Proto nejsou zpravidla navrženy tak, aby zajišťovaly jejich důvěrnost nebo chránily inform chatboty a jinými nástroji sdíleny. Myslete na to, že většina běžně dostupných chatbotů používá data, která do AI nástrojů vkl trénování modelů umělé inteligence. Tato data zároveň opouští vaše zařízení a zpracovávají provozovatele. Do běžně dostupných chatbotů proto nevkládejte citlivá data, osobní údaje nebo interní dat Tato chráněná a interní data můžete vkládat pouze do nástroje Microsoft Copilot pod univer nebo ve specifických případech do lokálně provozovaných modelů. Chráněná, interní a veřejná data [ URL "https://openscience.cuni.cz/OSCI-95.html"] ****************************************************************************************** * Proč je třeba myslet na ochranu dat? ****************************************************************************************** Z hlediska právní i etické odpovědnosti je nutné mít na paměti, že některá data podléhají – zejména osobní a citlivé údaje podle legislativy (např. GDPR) by neměly být vkládány do generativní AI. Chatboti obvykle fungují jako cloudové služby, což znamená, že zadávané informace opouští uživatele a zpracovávají se na serverech provozovatele. Vkládání jakýchkoliv osobních údaj adresa, hlasová nahrávka nebo IP adresa) – do těchto systémů bez výslovného souhlasu dotče rozporu s GDPR. Nejde jen o přímé vkládání dat do chatbotu, ale o jakoukoli formu zpřístupnění dat AI nást nástroji umožníme přístup k citlivým datům, je to z pohledu rizika v zásadě stejné, jako b přímo vložili do chatu. Udělování širokých oprávnění AI nástrojům (přístup k diskům, mailům, repozitářům) je velmi rizikové a nedoporučované. Většina veřejně dostupných chatbotů a nástrojů generativní AI navíc standardně používá vlo další trénování modelu. To představuje významné riziko nejen z pohledu ochrany osobních úd práci s informacemi chráněnými autorským právem, obchodním tajemstvím či smluvní mlčenlivo Pokud například do nástroje vložíme část textu z neveřejného výzkumu, studentské práce neb materiálu, systém si tyto informace může „zapamatovat“ a jejich fragmenty se mohou později výstupech poskytovaných jiným uživatelům. Navíc k těmto datům získává přístup samotný posk nástroje, který je může bez vašeho vědomí dále využívat. Tím může dojít nejen k narušení důvěrnosti ke vkládaným datům, ale i k nechtěnému úniku ch obsahu. Proto je nezbytné pečlivě zvažovat, co do AI systémů vkládáme, a kdykoli je to mož anonymizovanými či veřejně dostupnými zdroji. I v případě, kdy provozovatel AI nástroje nepoužívá data pro trénování nebo jiné vlastní ú hrozí riziko ztráty dat či jejich zneužití v důsledku bezpečnostního incidentu (např. útok chyby v konfiguraci, úniku záloh). Infrastruktura pro fungování AI nástrojů je zpravidla v zahrnuje mnoho subdodavatelů, díky čemuž významně roste i riziko takového úniku. Při sdílení dat s AI nástroji musíme tedy vždy předpokládat, že k jejich úniku dojít může. důležité dobře zvážit, zda je pro nás takové riziko přijatelné. Co jsou to chráněná data? Osobní údaje Jakákoliv informace, která umožňuje přímo či nepřímo ztotožnit konkrétní fyzickou osobu, j osobní údaj podle obecného nařízení o ochraně osobních údajů (GDPR) a zákona č. 110/2019 S osobních údajů. V rámci studia mohou často studující pracovat s osobními údaji v souvislosti s dotazníkový rozhovory, nahrávkami či při práci se zdravotnickou dokumentací. Kromě typických příkladů jako jsou identifikační údaje člověka (např. rodná čísla/jiná identifikační čísla u cizinc příjmení, datum narození, adresa), to mohou být i údaje, u kterých to na první pohled nemu zjevné, např. nahrávka hlasu, rentgenový snímek nebo IP adresa. Materiály obsahující osobní údaje je možné před vložením do nástroje generativní AI anonym přeformulovat. V praxi to znamená například vymazání jmen, jakýchkoliv identifikačních čís Zvlášť chráněnou kategorii pak představují tzv. zvláštní kategorie osobních údajů, mezi kt řazeny informace vypovídající o rasovém či etnickém původu, politických názorech, nábožens filozofickém přesvědčení nebo členství v odborech, genetické a biometrické údaje a údaje o či o sexuálním životě nebo sexuální orientaci. Základní pravidlo tedy zní, že uživatelé v zásadě nesmí do chatbotů a dalších nástrojů AI údaje, pokud k tomu nemají výslovný souhlas od osob, ke kterým se osobní údaje vztahují. H zásahu do soukromého života osob, ale také možné zneužití osobních údajů ze strany poskyto Současně se také jedná o zpracování osobních údajů, které musí být v souladu s nařízením G Některé externí nástroje generativní AI – zejména v placených verzích – nabízejí uživatelů využití zadaných dat pro další trénování modelu. Ačkoli tuto funkci doporučujeme vždy akti dostupná, je potřeba si uvědomit, že i v takovém případě data opouštějí počítač uživatele na serverech poskytovatele dané služby. Z tohoto důvodu nedoporučujeme vkládat citlivé informace nebo osobní údaje ani do chabotů, trénování vypnuto, pokud není ochrana dat ošetřena smluvně. Data chráněná autorským zákonem Data, která jsou jedinečným výsledkem tvůrčí činnosti fyzické osoby (tedy člověka, nikoli nebo nástroje generativní AI), jsou chráněna autorským právem jako autorská díla podle zák Sb. (autorský zákon). Autorských děl může vznikat široká škála; může jít například o dílo fotografické, výtvarné nebo kartografické. Autorským právem je chráněn i software, resp. j Je třeba mít na paměti, že již samotné vložení autorského díla do nástroje generativní AI autorského díla. K takovému užití díla musíme mít licenci (oprávnění od autora či držitele práv), nebo nám musí svědčit některá z výjimek autorského zákona, např. volné užití díla p potřebu. Mimo to je však nutné také věnovat pozornost podmínkám užití daného nástroje AI v skutečnosti, zdali se nástroj generativní AI trénuje na uživatelských promptech. V případě výstupů generativní AI si uživatelé musí dát pozor na to, že výstupy mohou obsah autorských děl třetích osob, jejichž zveřejnění prostřednictvím akademických výstupů by mo užití díla, ke kterému je potřeba získat od autora licenci. To platí také pro situace, kdy využití nástrojů generativní AI k úpravě díla, například obrázku, neboť dochází ke vzniku díla. V případě, že pak dochází k užití díla bez licence a současně takovému užití nesvědčí žádn autorského zákona (např. citační licence), tak se jedná o zásah do práv autora původního d autorovi následně vzniká právo domáhat se odstranění následků a poskytnutí přiměřeného zad způsobenou újmu. Jiná citlivá data V případě, že při tvorbě akademických výstupů na univerzitě má studující vztah k nějakému pracovněprávní vztah k?obchodní společnosti či státní instituci) a dochází k využití dat t tak je také nutné myslet na to, že tato data mohou být pro tento subjekt velmi cenná. Typicky by mohlo jít o data, na která se vztahuje povinnost mlčenlivosti upravená ve smlou smlouvě, dohodě o práci konané mimo pracovní poměr, ve smlouvě o spolupráci apod.), data p obchodní tajemství nebo data mající povahu utajované informace dle zákona č. 412/2005 Sb., utajovaných informací a o bezpečnostní způsobilosti. Vložením takových dat do nástrojů generativní AI by mohlo dojít k jejich vyzrazení, což by pro subjekt závažné důsledky. Proto v případě, kdy používáme taková data, je vždy v první konzultovat zpracování dat prostřednictvím nástrojů generativní AI s tímto subjektem. Microsoft Copilot Microsoft Copilot je nástroj umělé inteligence, který je v podobě webového chatbota dostup studujícím a zaměstnancům UK. Přihlášení uživatelé Microsoft Copilot mají několik výhod. Jde o přístup k výkonějšímu mod delších konverzací. Zásadní výhoda však spočívá ve zvýšené ochraně dat. Když se přihlásíte pomocí studentského zaměstnaneckého účtu, Copilot poskytuje komerční ochranu dat  [ URL "https://learn.microso copilot/microsoft-365/microsoft-365-copilot-privacy"] - to znamená, že vaše data jsou lépe chráněna. Jako každý nástroj, ani MS Copilot nelze považovat za stoprocentně bezpečný. Možnosti kont se s daty v celé infrastruktuře skutečně děje, jsou velmi omezené a i tato infrastruktura a data odcizena. Na rozdíl od běžně a zdarma dostupných chatbotů u MS Copilotu ovšem ochra data jsou smluvně chráněna. Zvýšená ochrana dat se vztahuje pouze na verzi Copilotu používanou pod univerzitním účtem. zaměňovat s běžnou veřejně dostupnou verzí Copilotu, která je zdarma. Do MS Copilot Chatu přihlašujte univerzitním účtem. Přihlaste se zde. [ URL "http://copilot.microsoft.com/"] Jak se přihlásit a více informací najdete zde. [ URL "https://ai.cuni.cz/AI-70.html"] Lokální modely Lokální modely generativní AI jsou modely, které běží přímo na zařízení uživatele – napřík osobním počítači nebo na zabezpečeném serveru dané instituce – a nekomunikují s externími službami. Díky tomu nedochází k odesílání ani ukládání dat mimo prostředí uživatele, což v riziko úniku nebo zneužití informací. Právě z tohoto důvodu lze do těchto modelů, při dodržení odpovídajících bezpečnostních opa i citlivá nebo interní data (např. výsledky výzkumu, studentské práce nebo osobní údaje), dostupných online nástrojů zpravidla nežádoucí či nepřípustné. Vyhodnocení, zda je prostředí, ve kterém je provozován lokální model, skutečně bezpečné, v znalosti. Doporučeno tak je používat jen takové lokální modely a prostředí, které jsou ofi a schváleny.  Pět zásad práce s nástroji AI Do běžných chatbotů nevkládajte osobní, citlivá, interní nebo jinak chráněná data. Vyhnete se tím riziku, že vaše data budou použita na trénování dalších modelů anebo že doj zneužití vašich dat. Používejte nástroje Generativní AI doporučené univerzitou nebo fakultou. Tyto nástroje mají ochranu dat smluvně ošetřenou. Když to jde, anonymizujte svá data. Při práci s jakýmkoliv chatbotem je nejbezpečnější data, která do nich vkládáte, anonymizo znamená například smazat jména, osobní čísla, adresy. Sdílejte s AI nástroji vždy jen nezbytné minimum dat pro daný úkol. Je rozdíl svěřit nástroji jeden konkrétní soubor a nebo mu otevřít přístup k celému disku Nesvěřujte AI nástrojům vysoce citlivá data, u kterých si v žádném případě nemůžete dovoli únik nebo zneužití. Žádný AI nástroj není zcela bez rizika. Teď, když znáte základní zásady ochrany dat, se můžete směle pustit do promptování a exper umělou inteligencí. Univerzita Karlova podporuje využívání nástrojů generativní umělé inteligence studujícími že je využití AI transparentní a v souladu s právním řádem ČR, předpisy Univerzity Karlovy součástí. Podívejte se na nástroje dostupné na univerzitě, přečtěte si první rady o promptování nebo pokud máte další otázky. Nástroje doporučené univerzitou [ URL "https://ai.cuni.cz/AI-9.html"] Rychlý start v promp "https://ai.cuni.cz/AI-79.html"] Doporučení vedení Univerzity Karlovy k bezpečnému užívání nástrojů generativní umělé intel "https://ai.cuni.cz/AI-68.html"] Kontaktujte nás [ URL "mailto:ai@cuni.cz"]