Co agencje reklamowe powinny wiedzieć o deep learningu
2019-09-30 12:59
Reklamy © maxkabakov - Fotolia.com
Przeczytaj także: DOOH jak gorąco, czyli co marketer może zrobić z pogodą
Czytając ostatnie publikacje dotyczące sztucznej inteligencji (SI) można odnieść wrażenie, że uczenie głębokie jest panaceum na wszystkie współczesne bolączki branży związanej z reklamą cyfrową. Najmłodsze dziecko w rodzinie SI może potencjalnie poprawić jakość prognoz, zwiększyć trafność przekazów oraz zredukować zjawisko ślepoty banerowej. Inżynier może zadać sobie pytanie, jakim cudem umknęła jego uwadze superszybka i niezwykle skuteczna technologia uczenia głębokiego, która zdążyła się już znacząco rozwinąć. Naukowcy poświęcili tej tematyce ponad 20 lat i osiągnęli sukcesy w wielu domenach, takich jak rozpoznawanie obrazu oraz obróbka tekstu i dźwięku.Co jednak z branżą reklamową, która działa w czasie rzeczywistym i wykorzystuje bardziej zaawansowane dane niż piksele i ramki dźwiękowe? Na tę chwilę branża ta nie dysponuje architekturą referencyjną, która pozwoliłaby osiągać podobne rezultaty, jak w przypadku obrazu, tekstu i dźwięku. Badacze z wielu uniwersytetów i instytucji dopiero zaczynają współpracę w zakresie uczenia głębokiego, a publikowane prace naukowe z tej dziedziny zaczynają być wykorzystywane przy pracach projektowych. Jako dyrektor jednej z dużych firm z branży technologii reklamowych mam świadomość zarówno potencjału drzemiącego w uczeniu głębokim, jak i jego pułapek.
Narzędzie uniwersalne
Sposób, w jaki mówimy o uczeniu głębokim przypomina mi telewizyjne reklamy narzędzi uniwersalnych. Dowiadujemy się z nich, że takie narzędzie jest w stanie rozwiązać wszystkie problemy domowych majsterkowiczów. Szczerze mówiąc, w większości przypadków to prawda. Przyjrzyjmy się klasycznemu przykładowi takiego narzędzia, jakim jest szwajcarski scyzoryk, za pomocą którego można m.in. otworzyć butelkę, naprawić rowerowy łańcuch, dokręcić śrubkę itd. Współczesne narzędzie wielofunkcyjne może stać się niezastąpione i właśnie o to chodzi.
fot. maxkabakov - Fotolia.com
Reklamy
Wyobraźmy sobie jednak, że chcemy zbudować w sypialni garderobę. Aby zrealizować to zadanie, potrzebujemy nie tylko odpowiednich narzędzi, ale także dobrej jakości materiałów oraz wiedzy technicznej. Być może uda nam się zbudować garderobę samodzielnie przy użyciu narzędzia uniwersalnego, ale zawsze możemy zlecić to zadanie doświadczonemu fachowcowi. Obserwując go przy pracy, zauważymy, że używa wielu różnych narzędzi, korzysta z materiałów wysokiej jakości i stosuje w praktyce wiedzę teoretyczną i doświadczenie. Wie, jak wykorzystać posiadane narzędzia i zasoby i może wcale nie potrzebować narzędzia uniwersalnego, o ile nie widzi w jego zastosowaniu wartości dodanej.
Jaki z tego wniosek? Niezależnie od tego, jak zaawansowane jest nasze narzędzie uniwersalne, nie pozwala ono rozwiązywać skomplikowanych problemów. Deep learning jest prawdopodobnie najbardziej zaawansowaną podkategorią uczenia maszynowego, która idealnie nadaje się do takich zadań, jak rozpoznawanie obrazu. Jednak w przypadku bardziej złożonych kwestii, takich jak reklamy cyfrowe wymagające mnóstwa wysokiej jakości danych (materiałów) oraz lat doświadczenia, narzędzie wielofunkcyjne nie może być naszym jedynym asem w rękawie.
Czy uczenie głębokie zaburza rynek reklamy cyfrowej?
Aby ułatwić zrozumienie szans i wyzwań związanych z uczeniem głębokim w kontekście reklamy, postaram się w prostych słowach wyjaśnić, jak działa uczenie maszynowe i głębokie.
- Uczenie maszynowe nadzorowane polega na uczeniu algorytmów analizy danych oraz ich kategoryzowania w celu zwiększenia skuteczności przewidywania. Dobrze znanym przykładem tej technologii jest filtr spamu w skrzynce e-mail, który wykrywa w korespondencji predefiniowane cechy spamu, takie jak zwroty „darmowe leki” lub „wygrałeś(aś) samochód”. W kontekście reklamy cyfrowej uczenie maszynowe potrafi przewidzieć prawdopodobieństwo kliknięcia baneru przez użytkownika. Człowiek konfiguruje cechy charakterystyczne i oczekuje wyniku w postaci etykiety „To jest spam” lub „Przewidywany współczynnik kliknięcia baneru przez tego użytkownika wynosi 0,8%”.
- Uczenie maszynowe nienadzorowane służy do rozpoznawania wzorców w bardzo dużych zbiorach danych. Człowiek przygląda się wynikom obliczeń i interpretuje je w sposób pozwalający na klasyfikowanie zachowań, np. „Ci użytkownicy dużo wydają” lub „Ci użytkownicy często kupują”. W przypadku nienadzorowanego uczenia maszynowego cechy charakterystyczne i etykiety nie są wymagane. Maszyny po prostu szukają zgrupowań wzorców nadających się do interpretacji.
- Uczenie głębokie nie jest osobnym pojęciem, a raczej podkategorią uczenia maszynowego. Największa różnica polega na tym, że nie wymaga ono definiowania odpowiednich funkcji. Technologia ta bazuje na zasadach sieci neuronowych i działa podobnie do ludzkiego mózgu. Deep learning jest w stanie rozpoznać na zdjęciu psa bez pomocy cech charakterystycznych wprowadzonych do komputera przez człowieka, takich jak „cztery łapy”, „ogon” itp. Skuteczność tej metody wnika z tysięcy przeanalizowanych wcześniej zdjęć psów. Umożliwiły to komputery o imponującej mocy obliczeniowej, które pojawiły się w ostatnich latach, oraz przetworzone przez nie ogromne zbiory danych.
Podstawową kwestią do rozważenia nie jest obecnie ewentualna wyższość uczenia głębokiego nad innymi podkategoriami uczenia maszynowego, ale to, czy na jego zastosowaniu mogą zyskać kampanie reklamowe. Odpowiedź brzmi: jeszcze nie lub wciąż w niewielkim stopniu. Dlaczego?
Pełne spektrum możliwości uczenia maszynowego
Deep learning wymaga ogromnych ilości danych. Aby pomyślnie rozpoznawać psy na zdjęciach, komputery muszą nauczyć się tego przez analizę terabajtów danych. Z tego względu wspomniane wcześniej sukcesy uczenia głębokiego odnotowano dotychczas w dziedzinach rozpoznawania obrazu, tłumaczeń językowych i gier, takich jak AlphaGo. Wszystko inne jest raczej mieszanką w ramach kategorii uczenia maszynowego.
Wdrożenie architektury uczenia głębokiego w branży reklamy cyfrowej wiązałoby się z koniecznością przetwarzania dużych zbiorów danych w czasie rzeczywistym. Branżę tę napędzają technologie związane z automatyzacją sprzedaży i zakupu reklamy w Internecie, podlegające znacznie surowszym ograniczeniom czasowym niż w przypadku innych zastosowań uczenia głębokiego (jednocyfrowe milisekundy). Taka implementacja wymagałaby maksymalizacji mocy obliczeniowej komputerów, a co za tym idzie inwestycji, dla których musiałaby najpierw zaistnieć potrzeba biznesowa w postaci np. ogromnych wzrostów, których dotychczas nie zauważono. Z tego względu architektury uczenia głębokiego nie są jeszcze spotykane w biddingu, a raczej używa się ich do wstępnej kalkulacji cech poza ścieżką krytyczną. Wygenerowane cechy mogą zostać wprowadzone do prostszego, tradycyjnego modelu uczenia maszynowego.
Czy to działa? Tak. Przeprowadziliśmy odpowiednie testy w naszym laboratorium SI. Czy działa lepiej od tradycyjnych modeli regresji logistycznej? Niekoniecznie i to z prozaicznego powodu, ponieważ wszystko sprowadza się do cech:
- Uczenie głębokie używa wielu nałożonych na siebie warstw i przetwarza surowe dane (takie jak pojedyncze piksele, znaki itd.). Nie są potrzebne ręcznie skonfigurowane cechy, ponieważ całą pracę wykonuje komputer. Na podstawie surowych danych najniższe warstwy wyodrębniają cechy niskiego poziomu, takie jak grupy znaków w przypadku tekstu czy linie i kąty w przypadku obrazu. Następnie warstwy wyższe łączą deskryptory niższego poziomu w celu wyodrębnienia funkcji najpierw średniego, a następnie wysokiego poziomu. Warstwy końcowe kodują oczekiwany wyniki (logikę biznesową), klasyfikując zdjęcia kotów i psów lub przewidując liczbę kliknięć i wyniki sprzedaży. Do wyszkolenia takiego systemu potrzeba ogromnych ilości danych, ponieważ niższe warstwy zawierają wiele neuronów, które trzeba nauczyć wykonywania zadań.
- Regresja logistyczna to model jednowarstwowy, który przetwarza cechy stworzone ręcznie. Dzięki temu jest szybsza i wymaga mniejszej mocy obliczeniowej w porównaniu z modelami głębokimi. Jeśli dysponujemy bardzo dobrą listą cech i wystarczającą ilością danych, metoda ta może spokojnie konkurować z uczeniem głębokim. Warto pamiętać, że warstwa regresji logistycznej jest często ostatnią warstwą w modelu głębokim, a różnica polega na sposobie obliczenia cech: komputer nauczył się ich na podstawie ogromnej ilości danych w ramach modelu głębokiego lub zostały one skonfigurowane ręcznie z wykorzystaniem wiedzy z danej dziedziny przez specjalistów ds. danych. Wartość dodana takich cech przejawia się w tym, że mają one wyraźne znaczenie i mogą zostać zrozumiane (i zdebugowane) przez ludzi, a ponadto mogą zostać wykorzystane do pomiaru efektywności różnych grup odbiorców.
Moja rada dla specjalistów ds. reklamy brzmi następująco: nie dajcie się nabrać na porównywanie uczenia maszynowego z głębokim i nie wierzcie tym, którzy twierdzą, że jeden z tych modeli jest lepszy od drugiego. Wracając do analogii z fachowcem, który wie, jak używać swoich narzędzi, doświadczenie w obcowaniu z uczeniem maszynowym pozwala uniknąć polegania tylko na jednym narzędziu. Należy przede wszystkim zastanowić się nad celem. Deep learning bez wątpienia odciśnie swoje piętno na branży reklamowej w przyszłości, jednak tylko w kontekście całego spektrum uczenia maszynowego obejmującego modele bazujące na drzewku, modele regresyjne, samoorganizujące się sieci SI i inne. Jeśli jesteś specjalistą lub inżynierem ds. danych pracującym w branży reklamowej, polecam stosowanie metody naukowej i przeprowadzanie eksperymentów na własnych danych i KPI. Sprawdź, które rozwiązanie daje więcej korzyści niezależnie od zastosowanej w nim implementacji.
Romain Lerallut, dyrektor ds. inżynierii w
oprac. : eGospodarka.pl
Przeczytaj także
Skomentuj artykuł Opcja dostępna dla zalogowanych użytkowników - ZALOGUJ SIĘ / ZAREJESTRUJ SIĘ
Komentarze (0)