Około 2015 roku, dzięki internetowi i mediom społecznościowym, zaczęło pojawiać się coraz więcej ogromnych zbiorów danych. Okazało się, że popularne filmy z kotami to świetny materiał, na którym sztuczna inteligencja może uczyć się rozpoznawania obrazów i identyfikowania scen. Reakcje, które zamieszczamy na Facebooku? Tak samo. Mówiąc inaczej, wiele osób uważa, że media społecznościowe nas ogłupiają, jednak to właśnie dzięki nim sztuczna inteligencja staje się bardziej inteligentna.
W tym samym czasie, kiedy zaczęły tworzyć się wspomniane zbiory danych, na rynkach pojawiły się wyjątkowo tanie i ogromnie wydajne procesory graficzne (czyli GPU – graphics processing units). Do dziś są one używane do przetwarzania coraz bardziej skomplikowanych grafik występujących w grach komputerowych, a wówczas zaczęły również napędzać sztuczną inteligencję. Ta stosunkowo drobna konwergencja – połączenie dużych zbiorów danych z tanimi i mocnymi procesorami graficznymi – dała początek jednej z najszybszych inwazji w historii, a sztuczna inteligencja zaczęła wkraczać we wszystkie aspekty naszego życia.
Najpierw pojawiło się uczenie maszynowe, które używa algorytmów do analizowania danych, uczenia się na ich podstawie i tworzenia prognoz dotyczących otaczającego nas świata. Przykładem mogą być serwisy Netflix i Spotify, które polecają swoim użytkownikom filmy i muzykę, ale również skonstruowany przez IBM Watson, który jest wykorzystywany do zarządzania majątkiem klientów.
Potem sieci neuronowe pojawiły się w internecie. Inspiracją do ich powstania była budowa ludzkiego mózgu, co oznacza, że są one zdolne do uczenia się bez nadzoru na podstawie nieuporządkowanych danych. Sztuczna inteligencja nie wymagała już podawania informacji w kolejności, jeden fragment za drugim. W przypadku sieci neuronowych wystarczyło umieścić dane w internecie, a system był w stanie zająć się całą resztą.
Jeśli chcemy zrozumieć, co stało się możliwe dzięki tej neuronowej sztucznej inteligencji zasilanej danymi z internetu, zastanówmy się nad sektorem usług, który dzisiaj odpowiada za ponad 80 procent amerykańskiego PKB. Eksperci zajmujący się klasyfikacją głównych zadań tego sektora najczęściej wyróżniają w nim 5 obszarów: patrzenie, słuchanie, czytanie, pisanie i łączenie zdobytej wiedzy w całość. W celu lepszego zorientowania się, w jakim miejscu sztuczna inteligencja jest teraz i dokąd będzie zmierzać, prześledźmy postęp, jaki do tej pory dokonał się w poszczególnych obszarach.
W obszarze patrzenia liczne innowacyjne rozwiązania pojawiają się już od wielu lat. W 1995 roku sztuczna inteligencja potrafiła odczytywać kody pocztowe z adresów umieszczanych na kopertach. W 2011 roku nauczyła się rozpoznawać 43 rodzaje znaków drogowych z dokładnością sięgającą 99,46 procent, czyli lepiej niż ludzie. Rok później sztuczna inteligencja ponownie osiągnęła lepsze wyniki niż ludzie. Tym razem nauczyła się klasyfikować ponad 1000 obrazów różnego typu, bezbłędnie odróżniając ptaki od samochodów, samochody od kotów i tak dalej. Dzisiaj te sieci są w stanie wyłapać konkretną osobę z tłumu, czytać z ruchu jej warg z dużej odległości, a analizując mikroekspresje i inne znaczniki biologiczne, potrafią określić, co tak naprawdę czujemy. Oprogramowanie monitorujące osiągnęło już taki poziom sprawności, że dron pilotowany przez sztuczną inteligencję jest w stanie precyzyjnie podążać za człowiekiem biegającym po gęstym lesie.
Jeśli chodzi o słuchanie, Echo produkcji Amazona, Google Home oraz HomePod autorstwa Apple’a zostały wyposażone w stale włączoną funkcję oczekiwania na nasze kolejne polecenia. Komputery nauczyły się rozpoznawania komend o całkiem wysokim stopniu skomplikowania. W 2018 roku Google zadziwił wszystkich, kiedy opublikował film, na którym zarejestrowano inteligentnego asystenta nazwanego Duplex, który dzwoni do salonu fryzjerskiego, żeby umówić wizytę. Wrócimy do tej historii w dalszej części książki, a na razie powiedzmy, że wywiązał się ze swojego zadania bezbłędnie. Znacznie ważniejsze okazało się jednak to, że recepcjonistka pracująca w salonie przez całą rozmowę nie domyśliła się, że rozmawia z maszyną.
Podobne postępy obserwujemy w czytaniu i pisaniu. Opracowana przez Google’a usługa Talk to Books (Porozmawiaj z książkami) pozwala zadać sztucznej inteligencji pytanie na dowolny temat. W odpowiedzi maszyna, po przeczytaniu 120 tysięcy książek w ciągu pół sekundy, wybiera z nich dla nas odpowiedni cytat. Nowość w stosunku do wcześniejszych rozwiązań tego typu polega na tym, że w odpowiedziach brane są pod uwagę intencje autora, a nie tylko słowa kluczowe. Poza tym sztuczna inteligencja wydaje się mieć poczucie humoru. Na pytanie „Gdzie jest niebo” odpowiedziała cytatem z Early History of Heaven (Historia początków nieba) autorstwa J. Edwarda Wrighta: „Nieba, jako miejsca przeznaczonego dla ludzi, nie można, jak się wydaje, znaleźć w Mezopotamii”.
Przechodząc do pisania, firmy takie jak Narrative Science korzystają obecnie ze sztucznej inteligencji, która jest w stanie tworzyć teksty o jakości pozwalającej na publikację w prasie. Powstają one bez jakiejkolwiek pomocy ze strony ludzi. W „Forbesie” tworzone są w ten sposób wiadomości biznesowe, a w tuzinie gazet codziennych – artykuły o baseballu. Aplikacja Smart Compose będąca częścią Gmaila potrafi już nie tylko podpowiadać właściwe słowa i poprawną pisownię, ale podsuwa nam całe zdania podczas pisania. Sztuczna inteligencja potrafi też napisać książkę. W 2017 roku podczas konkursu o narodową nagrodę literacką Japonii powieść stworzona przez maszynę dotarła do ostatniej rundy ocen.
Łączenie wiedzy w jedną całość, naszą ostatnią kategorię, najlepiej pokazać na przykładzie gier. Chociażby szachów. W 1997 roku komputer Deep Blue skonstruowany przez IBM pokonał ówczesnego mistrza świata Garriego Kasparowa. Złożoność drzewa gry w szachy wynosi około 1040. Oznacza to, że jeżeli każda osoba z ponad 7 miliardów ludzi na świecie znalazłaby sobie kogoś do pary i zaczęła grać w szachy, musiałoby minąć wiele bilionów lat nieustannego grania, zanim zostałyby rozegrane wszystkie możliwe warianty gry.
Mimo to w 2017 roku opracowany przez Google’a program AlphaGo pokonał mistrza świata w go Lee Sedola. Złożoność drzewa gry w go sięga 10360 – to szachy dla superbohaterów. Mówiąc inaczej, my, ludzie, jesteśmy jedynymi znanymi stworzeniami, które mają wystarczające zdolności poznawcze, by móc grać w go. Rozwinięcie tych zdolności w drodze ewolucji zajęło – bagatela – kilkaset tysięcy lat. Sztuczna inteligencja natomiast osiągnęła to w ciągu niecałych dwu dekad.
Na tym jednak nie poprzestała. Kilka miesięcy po tym zwycięstwie Google stworzył ulepszoną wersję AlphaGo nazwaną AlphaGo Zero. Aktualizacja polegała na zmianie sposobu uczenia się sztucznej inteligencji. Wcześniejsza AlphaGo była trenowana za pomocą uczenia maszynowego. Dostarczano jej tysiące zapisów gier rozegranych wcześniej przez ludzi i uczono, jakie są właściwe posunięcia i kontrposunięcia dla wszystkich możliwych ułożeń figur na szachownicy. Natomiast AlphaGo Zero nie potrzebowała żadnych informacji. Zamiast nich zastosowano metodę uczenia ze wzmocnieniem – sztuczna inteligencja uczyła się grać, grając sama ze sobą.
AlphaGo Zero rozpoczęła naukę, mając do dyspozycji niewiele więcej niż kilka prostych reguł, a już po 3 dniach pokonała swoją wcześniejszą wersję – AlphaGo, tę samą maszynę, która wygrała kiedyś z Lee Sedolem. Trzy tygodnie później rozgromiła 60 najlepszych graczy w go na świecie. Ostatecznie AlphaGo Zero potrzebowała 40 dni, żeby zdobyć niekwestionowaną pozycję najlepszego gracza w go na świecie. Jakby tego było