Tag noindex
Noindex to dyrektywa HTML lub nagłówek HTTP, która daje wyszukiwarkom jasny sygnał: nie indeksuj tej strony ani pliku. Strona z tym tagiem pozostaje dostępna – zarówno dla użytkowników, jak i robotów – ale nie pojawi się w wynikach wyszukiwania. To nie blokada dostępu, a kontrola nad tym, co trafia do indeksu.
Czym jest tag noindex
Tag noindex wyklucza wybrane treści z indeksu wyszukiwarek. Gdy nie chcesz, by konkretna podstrona była widoczna w wynikach wyszukiwania, a jednocześnie nie masz potrzeby jej ukrywać przed użytkownikiem, to narzędzie jest odpowiedzią. Różni się od blokady dostępu – ta ostatnia uniemożliwia botom pobranie strony, a noindex tylko decyduje o indeksacji.
Gdzie występuje noindex
Noindex pojawia się jako tag <meta> w kodzie HTML lub jako nagłówek HTTP X-Robots-Tag. Pierwsza opcja sprawdza się przy stronach HTML, druga – przy plikach PDF, obrazach czy wideo. Warto wiedzieć: nagłówek HTTP daje szersze możliwości, bo nie ogranicza się do jednego typu pliku.
Jak działa noindex
Robot wyszukiwarki odwiedza stronę, sprawdza dyrektywę i – jeśli znajdzie noindex – nie dodaje jej do indeksu. W przypadku Google, usunięcie strony z wyników następuje po kolejnym crawl’u i potwierdzeniu reguły. To nie jest natychmiastowe – czasem trzeba poczekać na aktualizację.
Noindex a robots.txt
Plik robots.txt nie zastępuje noindex. Google nie przyjmuje dyrektywy noindex w tym pliku – ignoruje ją. Jeśli bot nie ma dostępu do strony przez robots.txt, nie odczyta też polecenia noindex umieszczonego w kodzie. To częsty błąd w praktyce SEO.
Noindex a nofollow
Noindex dotyczy samej indeksacji strony, natomiast nofollow mówi robotom, by nie podążały za linkami na stronie. Obie reguły możesz połączyć: noindex, nofollow – wtedy strona nie trafi do indeksu, a linki nie będą analizowane przez wyszukiwarki. Czy zawsze trzeba łączyć te dyrektywy? Zależy od celu.
Jak wdrożyć tag noindex
Wdrożenie zależy od typu zasobu i sposobu publikacji. W HTML dodajesz meta tag do sekcji head. Dla plików innych niż HTML – PDF, obrazy – stosujesz nagłówek HTTP. W przypadku CMS-ów najczęściej masz opcję w ustawieniach strony lub wtyczce SEO – to przyspiesza pracę, zwłaszcza przy większych serwisach.
Tag meta w sekcji head
Chcesz, by wszystkie wyszukiwarki nie indeksowały strony? Dodaj meta name="robots" content="noindex" do sekcji head. Jeśli zależy Ci tylko na Google, użyj meta name="googlebot" content="noindex". To szybka zmiana, ale wymaga dostępu do kodu strony.
Nagłówek X-Robots-Tag
X-Robots-Tag jest praktyczny przy plikach nie-HTML – PDF, obrazach czy wideo. Ustawiasz go na poziomie serwera, bez edycji samego dokumentu. To rozwiązanie wybierają administratorzy, gdy trzeba objąć regułą całą grupę plików – np. wszystkie PDF-y.
Kiedy stosować tag noindex
Noindex przydaje się na stronach technicznych, logowania, koszyka, archiwów czy wyników wewnętrznego wyszukiwania. Pozwala ograniczyć indeksację treści, które nie powinny generować ruchu z Google. Masz wpływ na to, co widzi użytkownik w SERP-ach – to Twoje okno na świat.
Strony techniczne i pomocnicze
Do tej kategorii zaliczają się strony logowania, koszyk, polityki prywatności, wyniki wyszukiwania wewnętrznego czy strony podziękowań. Pełnią funkcję użytkową, ale nie są wartościowym celem dla ruchu organicznego. Dlatego nie powinny konkurować o pozycje w wynikach wyszukiwania.
Duplikaty i treści niskiej wartości
Noindex warto stosować dla archiwów, tagów, filtrów i stron w budowie. Przy duplikatach lub podobnych stronach czasem lepszym wyborem jest canonical – pozwala wskazać wersję preferowaną, zamiast całkowicie wykluczać stronę z indeksu. Wybór zależy od strategii SEO i struktury serwisu.
Najczęstsze problemy i alternatywy
Jeśli strona już trafiła do indeksu, samo dodanie noindex nie usuwa jej natychmiast. Google musi odwiedzić stronę ponownie, odczytać dyrektywę i dopiero wtedy ją wykluczyć. Czekasz na crawl – czasem kilka dni, czasem dłużej. To zmienia wszystko, jeśli zależy Ci na szybkiej reakcji.
Diagnostyka w Google Search Console
Status noindex sprawdzisz w Google Search Console i narzędziu inspekcji URL. Widzisz tam, czy dyrektywa została odczytana oraz czy wymagana jest ponowna indeksacja. To ważne, bo czasem reguła nie działa przez błąd w kodzie lub blokadę robots.txt – wtedy strona pozostaje w indeksie mimo ustawień.
Najczęściej zadawane pytania
Dodaj meta name="robots" content="noindex" do sekcji head. Jeśli chcesz, by reguła dotyczyła wyłącznie Google, wpisz meta name="googlebot" content="noindex". Prosta zmiana, a daje pełną kontrolę nad widocznością strony.
To polecenie dla wyszukiwarki, by nie indeksowała wskazanej strony lub pliku. Nie usuwa zasobu z serwera – użytkownik nadal ma dostęp, ale strona nie pojawi się w wynikach wyszukiwania. Kiedy warto ją stosować? Gdy treść nie powinna być widoczna w Google.
Wystarczy usunąć dyrektywę z HTML lub nagłówka HTTP i zgłosić prośbę o ponowne zindeksowanie. Jeśli strona była wcześniej w indeksie, robot musi odwiedzić ją jeszcze raz, by zmiana zaczęła działać. Cierpliwość – to klucz do skutecznego zarządzania widocznością.
Zastosuj noindex lub odpowiedni nagłówek X-Robots-Tag. Wybór metody zależy od tego, czy dotyczy strony HTML, czy innego typu pliku. Masz różne opcje, ale każda daje Ci kontrolę nad tym, co trafia do indeksu wyszukiwarek.