Co musisz wiedzieć o wyszukiwarkach
2007-09-27 13:22
Przeczytaj także: Google nie chce słowa "google"
Indeks można sobie wyobrazić jako ogromną bazę danych ważnych informacji o stronach www. Innowacyjne firmy np. Google, budowały swoją reputację studiując tę bazę danych - wychwytując statystyczne wzorce i algorytmiczne potencjały, odgadując nowe sposoby pozwalające na wykorzystanie ich w ostatecznym celu zapewniania jak najtrafniejszych odpowiedzi na zapytania. W procesie analizy indeksy są zapełniane znacznikami, które są metadanymi czyli danymi o danych. Znaczniki mogą na przykład informować o tym, że strona została napisana w określonych języku albo należy do określonej kategorii stron: pornograficznych, spamerskich albo rzadko aktualizowanych. Te metadane mają bardzo istotne znaczenie, ponieważ dają wyszukiwarce możliwość przedstawienia użytkownikom najtrafniejszych wyników.
Omawiając kwestię "jak", warto na moment przyjrzeć się konkretnym metodom stosowanym przez użytkowników. Rzecz można ująć lakonicznie: jesteśmy niewiarygodnie leniwi. Mamy niesłychaną skłonność do niewyrazistości, czyniąc z generowania przydatnych wyników pracę dla Herkulesa. Najczęściej wpisujemy kilka słów - zgodnie z raportem Majestic Research, prawie 50 procent wszystkich zapytań składa się z dwóch lub trzech słów, 20 procent z jednego, a tylko 5 procent zapytań wykorzystuje ponad sześć słów. Oczekujemy przy tym, że wyszukiwarka odpowie najtrafniejszymi wynikami. Osoba wpisująca do okienka wyszukiwarki na przykład "Abraham Lincoln biografia" nie jest przecież zainteresowana każdą stroną, na której znajdują się te słowa, ale tylko tymi stronami, na których znajduje się coś, co można uznać pojęciowo za biografię słynnego prezydenta. Ale jak takie pojęcie może zrozumieć wyszukiwarka? Jednym z rozwiązań są słowa-wskazówki podpowiadające wyszukiwarce kontekst. W tym przypadku "biografia" to pojęcie, a nie tylko słowo ,które może się znaleźć na stronie. Dobra wyszukiwarka połączy tę wskazówkę ze zbiorami wyników mieszczącymi się w pojęciu "biografia" - stronami, które zostały oznakowane jako biograficzne. Dodatnie tych nowych meta danych często radykalnie poprawia wyniki. Inne przykłady takich wskazówek to "recenzje filmowe", "notowania giełdowe" czy "prognozy pogody". Większość wyszukiwarek pozwala zawęzić wyszukiwanie na podstawie frazy, domeny, typu pliku, położenia geograficznego, języka i liczby wyświetlanych adresów. Można załączać lub wyłączać słowa, ustalać ramy czasowe, a często nawet szukać stron, które są podobne do tych znalezionych.
Mimo to ponad 95 procent użytkowników nigdy nie korzysta z zaawansowanych funkcji dostępnych w większości wyszukiwarek, a większość ekspertów zgadza się, że wskaźnik ten prawdopodobnie nigdy się nie obniży. Chcemy jak najszybciej uzyskiwać wyniki i chcemy, aby wyszukiwarka wyświetliła je nie zmuszając nas do uczenia się trudnego, nowego języka programowania. Stąd przed wyszukiwarkami stoi ogromne wyzwanie opracowywania coraz lepszych sposobów odgadywania intencji użytkownika i przenoszenia ich na algorytmy wyszukiwania danych w indeksie.
Druga rzecz - KTO
Kto przeszukuje sieć? Odpowiedź najprostsza "prawie każdy" nie jest satysfakcjonująca. Trochę na ten temat można się dowiedzieć z zebranych do tej pory informacji temat nawyków wyszukiwania. Latem 2004 roku ośrodek Pew Internet & American Life Project opublikował dokument na temat korzystania z Internetu w USA. Wynika z niego, że 85 procent wszystkich korzystających z Internetu Amerykanów używa wyszukiwarek (czyli w Stanach Zjednoczonych ponad 107 milionów osób). Ponad dwie trzecie z nich to aktywni poszukiwacze - stosują jedną lub więcej wyszukiwarkę ponad dwa razy w tygodniu, co daje średnio ponad trzydzieści wyszukiwań w miesiącu.
Przeczytaj także:
Czy SearchGPT może zagrozić Google?
oprac. : Wydawnictwo Naukowe PWN