Reklama
Polityka_blog_top_bill_desktop
Polityka_blog_top_bill_mobile_Adslot1
Polityka_blog_top_bill_mobile_Adslot2
Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości

14.05.2018
poniedziałek

Dzwonię do Pani w bardzo nietypowej sprawie – tu Google Duplex

14 maja 2018, poniedziałek,

„Usłyszycie, jak Google Assitant dzwoni do prawdziwego zakładu fryzjerskiego, by zapisać użytkownika na strzyżenie” – mówi CEO firmy Google Sundar Pichai na tegorocznej konferencji Google IO, na której firma prezentuje najbardziej przełomowe rozwiązania. Słychać oklaski i podekscytowane okrzyki.

„Hi, dzwonię, by zapisać klientkę na strzyżenie, ummm” – mówi sztuczna inteligencja.

Projektant Chris Messina nazwał Google Duplex (sztucznego asystenta głosowego) „niesamowitą i przerażającą rzeczą”. I wrzucił Dupleksa na poziom technologicznej ekstraklasy, zarezerwowanej dla najbardziej przełomowych technologii. W jego tweecie słychać echa pierwszego telegramu: „Co też Bóg uczynił?”. Choć z drugiej strony Duplex w pierwszym zdaniu powiedział „ummm” niczym klasyczna Valley Girl. Dzięki czemu wydarzenie można odebrać jako wiekopomne, ale równie dobrze jako czeską komedię.

W całej historii na pewno nie chodzi o to, że Google stworzył maszynkę do dzwonienia za nas do fryzjera. A rozwiązanie generuje różne wyzwania regulacyjne i dylematy społeczne. Komentatorzy natychmiast podnieśli takie wątki jak poprawne oznaczanie takiego rozmówcy jako „sztucznego”, zgodność z przepisami dotyczącymi nagrywania rozmów telefonicznych bez wiedzy rozmówcy. Narzuca się też myśl, dlaczego pracownica zakładu fryzjerskiego nie miałaby też być botem. (I czy miałoby sens, żeby boty ze sobą rozmawiały?). To nie mogą być kwestie zaskakujące dla zespołu Dupleksa. Dużo ciekawsze niż szukanie odpowiedzi na te (ważne) pytania jest zrozumienie, dlaczego Google tak, a nie inaczej zaprezentował Dupleksa. I dlaczego kluczowe pytania odłożono na później.

Oficjalna linia firmy w kwestii oznaczania sztucznego głosu (bo jak inaczej to nazwać?) brzmi: na razie pokazaliśmy demo, pełen produkt będzie w przejrzysty sposób komunikować swoją sztuczną naturę. Trochę mnie nie dziwi, że demo nie zaczęło się od firmowego dżingla „To ja, AI” (wyobraźcie sobie coś na kształt melodyjki puszczanej przy uruchamianiu Windowsa) i nie skończyło formułką podobną do tych puszczanych w reklamach leków, z lektorem mówiącym dwa razy szybciej niż zwykle. Albo że robogłos został podkręcony o oktawę w górę niczym Stan Borys w teledysku Pei. Dlaczego nie miałoby to sensu? Bo zakłócałoby dekorum „prawdziwej ludzkiej rozmowy”. W Google Duplex nie chodzi tylko o to, by sztuczny asystent oszczędził nam czasu na powtarzalnych rozmowach telefonicznych – dużo szybciej i prościej inteligentni asystenci mogą to zrobić, komunikując się bez słów (głosowy asystent będzie miał sens w okresie przejściowym, kiedy fryzjerzy nie będą jeszcze mieli własnych usług AI). Myślę, że marzeniem firmy jest, by spełniając niezbędne wymogi prawne, „podrobić” prawdziwego człowieka w rozmowie z drugim człowiekiem.

Na Google Duplex trzeba więc patrzeć w kontekście doniesień o technologiach pozwalających spreparować nagranie audiowideo „autentycznej” wypowiedzi dowolnej osoby. W zeszłym roku pojawiło się tego rodzaju nagranie z nieprawdziwą wypowiedzią Obamy – rodząc masę obaw o wpływ tego rodzaju technologii na debatę publiczną, zaufanie społeczne i w ogóle na politykę. Obama poszedł na pierwszy ogień, bo badacze mieli dużo materiału do wykorzystania. Ale wielu z nas generuje dużo wideo – więc problem zostanie niebawem rozwiązany. Google Duplex mówi na razie sześcioma głosami, ale pewnie wkrótce będzie mógł mówić dowolnym.

Kolejne dobre pytanie na temat Google Duplex brzmi: po co nam taka technologia? Mam kłopot z punktem widzenia, że biznes znajdzie swój „use case”. W przypadku fundamentalnych technologii, zmieniających życie społeczne – a taką na pewno jest „sztuczny partner w rozmowie” – nie możemy oddać w ręce biznesu pytań o zastosowania, rozmawiać wyłącznie o monetyzacji i efektywności. Rozmawiajmy o zaufaniu, pracy, relacjach społecznych. Najważniejsze jest nie to, jak na tym zarabiać, ale to, jak Dupleksa oswoić, jak upewnić się, że nie wywróci świata społecznego do góry nogami. I nie chodzi o to, by biznes nie był w to zaangażowany – tylko by zadawał odpowiednie pytania, przede wszystkim o swoją odpowiedzialność. Przypadek Google Duplex pokazuje, że na razie są one zadawane w drugiej kolejności.

Jakiś strateg firmy sprytnie wybrał „rozmowę z zakładem fryzjerskim” jako uderzającą w odpowiedni ton codzienności i niewinności. Kłania się teza Venkata Rao o „manufactured normalcy” – czynnikach powodujących, że czujemy się normalnie, obcując z szokującymi technologiami. Zwróćcie uwagę, że gdyby to fryzjerka była sztuczna w rozmowie przedstawionej na konferencji, Google otwierałby się na zarzuty o powodowanie „końca ludzkiej pracy”. A tak mamy do czynienia z przyjaznym asystentem, ułatwiającym nam życie.

Zresztą zespół Dupleksa, gdyby tylko chciał, mógł zapewne przedstawić nagranie z wywiadu Remigiusza Grzeli z Marilyn Monroe czy nowe przemówienie Churchilla. Projekt pozwala myśleć o zupełnie nowych, interaktywnych i opartych na słuchu trybach uczenia się. Chcąc mieć wersję audio jakiegoś tekstu, moglibyśmy – zamiast oldschoolowego audiobooka – wziąć udział w wykładzie albo może nawet rozmowie z autorem tekstu. Kłaniają się ludzie-książki „Fahrenheit 451”!

Mam trochę pretensję do Google, że prezentuje technologię w scenariuszu całkowicie banalnym. Eksperymenty myślowe są nam potrzebne, by zrozumieć, do czego nowe, kluczowe technologie mogą się przydać. I nawet jeśli zdolność produkowania nowych technologii jest skupiona w kilku miejscach na świecie (i nie należy do nich warszawski Mordor), to z dowolnego miejsca na świecie możemy myśleć o ich społecznym wymiarze, możliwych skutkach i wyobrażonych zainteresowaniach. Nie marnujmy więc tej szansy.

*

Polecam rozmowę Johna Battelle z Matthew Princem z Cloudflare. Zdaniem Prince’a przejrzystość, odpowiedzialność i konsekwencja – czyli rządy prawa – to fundamenty, na których należy budować technologie. (Polecam też przepięcie się na 1.1.1.1, darmowy serwis DNS, stworzony przez Cloudflare, chroniący lepiej prawa użytkowników).

W Centrum Cyfrowym przyglądamy się metodzie dizajnu spekulatywnego jako sposobowi na oswajanie technologii i mówienie o ich skutkach społecznych – ostatnio zrobiliśmy warsztat na ten temat na konferencji PDF CEE. O tym, jak stworzyć lepszą przeszłość, przeczytacie na blogu Centrum.

Reklama
Polityka_blog_bottom_rec_mobile
Reklama
Polityka_blog_bottom_rec_desktop