DeepSeek – rewolucja w cieniu obaw o prywatność i bezpieczeństwo

6 min

chat bot AI

Przyszłość jest tu i teraz – masz pod ręką sztuczną inteligencję, która pisze za Ciebie maile, analizuje rynek i projektuje kampanie reklamowe. A wszystko to za darmo, bo właśnie tym kusi chiński DeepSeek. Brzmi świetnie, prawda? Jednak zanim rzucisz się w wir automatyzacji, sprawdź, jakie dane są gromadzone na serwerach i dowiedz się, dlaczego kolejne rządy wyrażają zaniepokojenie tą aplikacją.

Czym jest DeepSeek i dlaczego tak szybko zyskał popularność?

DeepSeek to chiński model AI, który w ciągu ostatnich tygodni przebojem wdarł się do mainstreamu. Usługa wzbudziła tak duże zainteresowanie, że dochodziło wręcz do sytuacji, kiedy internauci musieli czekać po kilka dni w „kolejce”, by ukończyć procedurę rejestracji i zacząć z niej korzystać.

Co ciekawe, twórcy utrzymują, że stworzenie tego oprogramowania kosztowało tylko 6 milionów dolarów. Dlaczego „tylko”? Ponieważ do powstania ChatGPT od OpenAI trzeba było zgromadzić ponad 100 milionów dolarów! Specjaliści z Państwa Środka nie tylko zaoszczędzili sporą sumę, ale też udało im się opracować narzędzie, które:

  • działa do trzech razy szybciej niż główni konkurenci,
  • w większości zastosowań przewyższa najlepsze modele,
  • świetnie radzi sobie z generowaniem kodu i analizą plików graficznych.

Kluczem do sukcesu okazała się rewolucyjna metoda trenowania AI oparta na uczeniu przez wzmacnianie pozytywne (Reinforcement Learning, RL). Ta technika, inspirowana sposobem, w jaki wiedzę zdobywają ludzie, polega na nagradzaniu modelu za poprawne odpowiedzi i karaniu za błędy.

Mówiąc obrazowo: na pytanie „ile to 2+2” model otrzymałby pochwałę za odpowiedź „4”, a zostałby skarcony za każdą inną. DeepSeek wykorzystał tę metodę w zaawansowanym, wieloetapowym procesie uczenia, gdzie skala trudności rosła proporcjonalnie: najpierw pojawiały się proste, wręcz banalne zadania, a dopiero później, w kolejnych cyklach RL dochodziły coraz bardziej złożone zagadnienia.

Cykle RL (Reinforcement Learning) to iteracyjny proces, w którym model uczy się podejmowania optymalnych decyzji poprzez:
  • wykonywanie akcji w środowisku (np. odpowiadanie na pytania),
  • otrzymywanie nagród lub kar za poprawność tych akcji (np. pochwała czy skarceń za błędną odpowiedź),
  • aktualizację strategii (polityki) na podstawie zebranych doświadczeń.

Każdy prawidłowo zaprogramowany trening RL powinien opierać się na stopniowym zwiększaniu poziomu trudności, a każda próba musi dostarczać informacji o tym, jak poprawić wyniki w kolejnych krokach).

Co dała DeepSeekowi taka taktyka? Pozwoliła rozwinąć zdolność samodzielnego rozumowania i rozwiązywania złożonych zadań przez zdobywanie doświadczenia, czyli tak jak uczą się ludzie. Nie jest to pierwsze takie podejście do edukowania modelu, bo specjaliści stojący za Mistralem już wcześniej z powodzeniem wdrażali MoE (Mixture of Experts) – architekturę modeli AI, w której wiele wyspecjalizowanych podsieci neuronowych („ekspertów”) współpracuje pod nadzorem sieci bramkującej (routera).

Posłużmy się tutaj prostym przykładem: w modelu językowym ekspert A może specjalizować się w składni, ekspert B w semantyce, a ekspert C w parametrach technicznych. To właśnie bramka decyduje o tym, którego użyć w konkretnej sytuacji – DeepSeek rozwinął tę koncepcję na niespotykaną dotychczas skalę.

Model

DeepSeek V3

LLAMA 3.1 Claude 3.5 ChatGPT 4o
Architektura MoE transformer transformer transformer
Suma parametrów 671 miliardów 405 miliardów nie ujawniono nie ujawniono
Dokładność MMLU dla języka angielskiego 88,5% Nie ujawniono 88,3% 87,2%
Wynik w teście HumanEval-Mul 82,6% Nie ujawniono 81,7% 80,5%
Kluczowe atuty wysoka wydajność świetny do pracy z kodem bezpieczeństwo danych wszechstronność

ocena największych modeli w teście wnioskowania MMLU

Ocena największych modeli w teście wnioskowania MMLU

Jak DeepSeek może usprawnić codzienną pracę w małej firmie?

Wyobraź sobie, że prowadzisz agencję kreatywną. Zamiast godzinami obmyślać idealne hasło reklamowe, możesz wgrać swoje propozycje do modelu, który w kilka chwil podsumuje kluczowe dane, wybierze najciekawsze propozycje i sprawdzi ich zgodność z wytycznymi, jakie podesłał klient.

DeepSeek sprawdzi się też w następujących zastosowaniach:

  • chatboty – do automatyzacji odpowiedzi na częste pytania klientów (np. o godziny otwarcia czy dostępność produktu),
  • generowanie treści – od tworzenia opisów produktów po posty na LinkedIn,
  • analiza danych – na przykład historycznych lub sezonowych,
  • tłumaczenia – do błyskawicznych przekładów ofert np. na angielski czy niemiecki.

Wygląda świetnie, prawda? A warto dodać jeszcze, że chińskie przedsiębiorstwo udostępniło swój model za darmo! Gdzie zatem jest haczyk? Niestety, w tym konkretnym przypadku, świetna i pod wieloma względami rewolucyjna technologia zderza się z polityką i obowiązującymi w Europie normami prawnymi.

Prywatność, czyli ciemna strona DeepSeek’a?

Firma stojąca za tym narzędziem jest powiązana z azjatyckim funduszem hedgingowym High-Flyer, a jej serwery znajdują się w Chinach. Rodzi to pytania o bezpieczeństwo – zwłaszcza dla podmiotów, które przetwarzają informacje wrażliwe.

Sytuacji nie poprawiają już zweryfikowane informacje o tym, jakie dane gromadzi aplikacja mobilna. Na liście uprawnień znajdziemy między innymi:

  • dostęp do treści czatów (nawet tych usuniętych),
  • metadane plików,
  • wzorce aktywności(np. godziny pracy),
  • dane geolokalizacyjne.

Co gorsza, zgodnie z regulaminem DeepSeek może udostępniać te informacje chińskim podmiotom – także reklamodawcom i „dostawcom usług”. Dość łatwo można wyobrazić sobie sytuację, kiedy informacje wrażliwe (na przykład zgłoszenie patentowe czy wycena przygotowywana z myślą o przetargu) trafią w niepowołane ręce.

Firma z Państwa Środka została też bohaterem kilku skandali, gdy okazało się, że jej generatywna sztuczna inteligencja nie cenzuruje zapytań potencjalnie niebezpiecznych, na przykład tych związanych z wykradaniem danych czy budowaniem broni z produktów dostępnych w domu. Wątpliwość budzą też dane treningowe – DeepSeek często przedstawia się jako ChatGPT, co może budzić pewne podejrzenia o to, w jaki sposób uczony był model.

Problematyczne może być też chińskie prawo – lokalne przepisy zmuszają firmy do współpracy z rządem zawsze, gdy ten wyrazi taką konieczność. Choć nie ma dowodów na to, że Pekin korzystał z DeepSeeka do szpiegowania, amerykańska marynarka wojenna już zakazała jego używania, a Australia ostrzega przed „poważnymi zagrożeniami”.

DeepSeek a RODO – czy polskie firmy mogą legalnie korzystać z chińskiego AI?

Odpowiedź na to pytanie jest niejednoznaczna. Zgodnie z Rozporządzeniem o Ochronie Danych Osobowych przekazywanie informacji do krajów spoza Unii Europejskiej (jak Chiny) jest dozwolone tylko pod warunkiem spełnienia rygorystycznych standardów. Tymczasem DeepSeek:

  • nie gwarantuje, że nie wykorzysta poufnych informacji do szkolenia modeli (np. tajemnic handlowych),
  • nie oferuje ochrony przed naruszeniami praw autorskich,
  • nie ma filtra blokującego nielegalne treści.

Czy można używać tego narzędzia z zachowaniem pewnych standardów bezpieczeństwa? Dobrym rozwiązaniem jest skorzystanie z Perplexity, które zaimplementowało już rozwiązania z modelu R1, czyli z najnowszej i najlepszej wersji oprogramowania, którą początkowo udostępnił DeepSeek.

Co warto podkreślić, w tym scenariuszu będziemy korzystać z serwerów znajdujących się w Stanach Zjednoczonych, co z pewnością jest rozwiązaniem łatwiejszym do zaakceptowania dla wielu firm i osób prywatnych.

Jeśli jednak postanowisz, że chcesz korzystać z „oryginalnego”, chińskiego DeepSeeka trzymaj się kilku prostych zasad:

  • unikaj przesyłania danych wrażliwych – zarówno firmowych, jak i prywatnych,
  • staraj się czyścić historię czatów po każdej sesji,
  • pamiętaj, że możesz skorzystać też z wersji open-source (np. DeepSeek Coder), hostując model na własnych serwerach.

Stosując się do tych prostych wytycznych, znacznie zwiększasz poziom bezpieczeństwa swoich danych. Sztuczna inteligencja z Chin to ogromne szanse, ale i sporo niewiadomych. Warto więc obrać taktykę ograniczonego zaufania – przynajmniej do czasu, aż twórcy aplikacji nie spełnią rygorystycznych norm, jakie narzuca na przykład RODO czy AI Act.

Kamil Kolbusz
Kamil Kolbusz
Head of Content/Partner takaoto.pro
Obserwuj mnie na LinkedIn
Czy ten artykuł był przydatny?
średnia: 0 | 0 ocen

Przeglądaj tematy

  • #na startwięcej artykułów z tagiem:#na start
  • #bizneswięcej artykułów z tagiem:#biznes
  • #podatkiwięcej artykułów z tagiem:#podatki
  • #marketingwięcej artykułów z tagiem:#marketing
  • #prawowięcej artykułów z tagiem:#prawo
  • #strategiawięcej artykułów z tagiem:#strategia
  • #pracownicywięcej artykułów z tagiem:#pracownicy
  • #księgowośćwięcej artykułów z tagiem:#księgowość
  • #wideowięcej artykułów z tagiem:#wideo
  • #finansowaniewięcej artykułów z tagiem:#finansowanie
  • #sprzedażwięcej artykułów z tagiem:#sprzedaż
  • #markawięcej artykułów z tagiem:#marka
  • #ekowięcej artykułów z tagiem:#eko
  • #ESGwięcej artykułów z tagiem:#ESG
  • #pomysł na bizneswięcej artykułów z tagiem:#pomysł na biznes
  • #zmiany w prawiewięcej artykułów z tagiem:#zmiany w prawie
  • #e-commercewięcej artykułów z tagiem:#e-commerce
  • #wsparcie dla firmwięcej artykułów z tagiem:#wsparcie dla firm
  • #ZUSwięcej artykułów z tagiem:#ZUS
  • #internetwięcej artykułów z tagiem:#internet
  • #automatyzacjawięcej artykułów z tagiem:#automatyzacja
  • #AIwięcej artykułów z tagiem:#AI
  • #media społecznościowewięcej artykułów z tagiem:#media społecznościowe
  • #samodzielna księgowośćwięcej artykułów z tagiem:#samodzielna księgowość
  • #przewodnikwięcej artykułów z tagiem:#przewodnik
  • #SEOwięcej artykułów z tagiem:#SEO
  • #dotacjewięcej artykułów z tagiem:#dotacje
  • #leasingwięcej artykułów z tagiem:#leasing
  • #service designwięcej artykułów z tagiem:#service design
  • #fakturywięcej artykułów z tagiem:#faktury
  • #instrukcjawięcej artykułów z tagiem:#instrukcja
  • #technologiewięcej artykułów z tagiem:#technologie
  • #dokumentywięcej artykułów z tagiem:#dokumenty
  • #kredytwięcej artykułów z tagiem:#kredyt
  • #RODOwięcej artykułów z tagiem:#RODO
  • #oszczędnościwięcej artykułów z tagiem:#oszczędności
  • #bankowośćwięcej artykułów z tagiem:#bankowość
  • #ochrona środowiskawięcej artykułów z tagiem:#ochrona środowiska
  • #ITwięcej artykułów z tagiem:#IT
  • #podcastwięcej artykułów z tagiem:#podcast
  • #wynagrodzeniawięcej artykułów z tagiem:#wynagrodzenia
  • #kontrahentwięcej artykułów z tagiem:#kontrahent
  • #analizawięcej artykułów z tagiem:#analiza
  • #google analyticswięcej artykułów z tagiem:#google analytics
  • #ubezpieczeniewięcej artykułów z tagiem:#ubezpieczenie
  • #Polski Ładwięcej artykułów z tagiem:#Polski Ład
  • #umowywięcej artykułów z tagiem:#umowy
  • #badaniewięcej artykułów z tagiem:#badanie
  • #długiwięcej artykułów z tagiem:#długi
  • #faktoringwięcej artykułów z tagiem:#faktoring
  • #USwięcej artykułów z tagiem:#US
  • #konkurencjawięcej artykułów z tagiem:#konkurencja
  • #urlopywięcej artykułów z tagiem:#urlopy
  • #CEIDGwięcej artykułów z tagiem:#CEIDG
  • #płynność finansowawięcej artykułów z tagiem:#płynność finansowa
  • #zakupywięcej artykułów z tagiem:#zakupy
  • #inwestycjewięcej artykułów z tagiem:#inwestycje
  • #webinarwięcej artykułów z tagiem:#webinar
  • #kosztywięcej artykułów z tagiem:#koszty
  • #zdolność kredytowawięcej artykułów z tagiem:#zdolność kredytowa
  • #REGONwięcej artykułów z tagiem:#REGON
  • #współpracawięcej artykułów z tagiem:#współpraca
  • #SEMwięcej artykułów z tagiem:#SEM
  • #gwarancjawięcej artykułów z tagiem:#gwarancja
  • #BHPwięcej artykułów z tagiem:#BHP