Sonnet 4.6 czy Gemini 3.1 PRO – który jest lepszy pod SEO?
Zaledwie kilka dni temu Anthropic wypuścił nowego Soneta 4.6, a cały internet oszalał na punkcie jego możliwości. Chwilę później Google odpowiedziało premierą Gemini 3.1 Pro i… internet oszalał ponownie. Zewsząd zalewają nas benchmarki i wykresy udowadniające, który model jest szybszy, tańszy czy mądrzejszy. Ale bądźmy szczerzy – w codziennej pracy agencji marketingowej suche liczby schodzą na dalszy plan.
Runda 1: Generowanie Content Briefów (Starcie na głębokość)
W naszej agencji korzystamy ze skryptu w Pythonie (liczącego prawie 1400 linijek kodu!), który analizuje konkurencję, wyniki SERP i wyciąga szczegółowe dane do tworzenia briefów. Postanowiłem wygenerować brief na tę samą frazę, z tymi samymi wytycznymi, za pomocą obu modeli przez OpenRouter.
Wyniki na pierwszy rzut oka:
- Gemini 3.1 Pro: Wygenerował brief na 180 linijek. Zawierał podstawowe encje, metryki EAV, content gap i checklistę.
- Sonnet 4.6: Wygenerował potężny brief na prawie 800 linijek. Znalazła się w nim centralna encja, pełne metryki, Top 5 look i wiele więcej.
Aby ocena była obiektywna, poprosiłem o nią najpotężniejszy obecnie model – Opusa 4.6.
Werdykt sędziego:
- Sonnet (Ocena: 8,5/10): Pełna głębokość i kompletność. 20 encji z pełną klasyfikacją, 7 zweryfikowanych faktów, 22 relacje. Struktura artykułu dostarcza pełne metadane dla każdej sekcji (intent type, format, encje, fakty). To brief produkcyjny – copywriter może z nim od razu siadać do pisania.
Link do tego briefu: https://docs.google.com/document/d/1xhDwtNBo0Tv4-HKYzxaqB69CG8O-TBMS08wlCR2pZY4/edit?usp=sharing
- Gemini (Ocena: 5,5/10): Brief płytszy. Choć wygenerował 25 encji, wiele z nich to „halucynacje” i przypadkowe byty z researchu konkurencji (np. hotele czy słońce w nierealnych wyróżnikach agencji). Daje jedynie szkicowe opisy sekcji bez precyzyjnych wytycznych. To raczej zarys strategiczny, który wymaga dopracowania.
Link do tego briefu: https://docs.google.com/document/d/1Mi9kfEp_vE9LHZQeVlXv8ASHxnED8jXaJJY2pNc1Npo/edit?usp=sharing
🏆 Zwycięzca Rundy 1: Zdecydowanie Sonnet 4.6.
Runda 2: Pisanie artykułu na podstawie wygrywającego briefu
Skoro Sonnet napisał nam rewelacyjny brief, postanowiłem sprawdzić, jak modele poradzą sobie z napisaniem na jego podstawie gotowego artykułu. Do testu stanęły trzy „narzędzia”:
- Mój customowy Gem (skonfigurowany specjalnie pod pisanie tekstów).
- Google AI Studio z czystym modelem Gemini 3.1 Pro (Thinking Level: High).
- Claude Sonnet 4.6.
Ocenialiśmy pokrycie briefu (czy w tekście znalazły się wymagane nagłówki, tabele, fakty, encje, słowa TF-IDF i pokrycie semantyczne). Teoretycznie teksty AI powinno pisać się nagłówek po nagłówku, ale chciałem sprawdzić, jak modele radzą sobie z dużym kontekstem „na raz”.
Wyniki testu pisania:
- Customowy Gem: 80% pokrycia briefu. Ocena: 7/10. (Zaskakująco, poradził sobie najgorzej). Zobacz
- Gemini 3.1 Pro (AI Studio): 90% pokrycia briefu. Ocena: 8,5/10. Zobacz
- Sonnet 4.6: 95% pokrycia briefu. Ocena: 9/10. Zobacz nasz artykuł o SEO dla hoteli
🏆 Zwycięzca Rundy 2: Ponownie Sonnet 4.6, ale…
Ważny wniosek: Gemini 3.1 Pro dostępny za darmo w Google AI Studio wygenerował świetny tekst na 8,5/10 zaledwie w jednym strzale! To oznacza, że jeśli nie chcesz płacić za dostęp do Soneta, darmowe Google AI Studio sprawdzi się doskonale. Pokazuje to też jeszcze jedną kluczową kwestię: dobry brief to 90% sukcesu.
Tutaj możecie zobaczyć pełne porównanie: https://docs.google.com/spreadsheets/d/1go3_6pvU7U7e9WHJ4OWdyFVzXqvuyUzB/edit?usp=sharing&ouid=106589146889673041472&rtpof=true&sd=true
Runda 3: Analiza Danych SEO (Google Search Console)
W ostatnim teście wrzuciłem modelom dane z GSC naszej domeny za ostatnie 3 miesiące. Prompt był prosty: „Jesteś profesjonalnym analitykiem danych i specjalistą SEO. Przeanalizuj wyniki, wskaż potencjały do poprawy na frazy komercyjne i stwórz plan działania na 3 miesiące”.
Jak do zadania podeszły modele?
- Podejście Gemini 3.1 Pro: Narracyjne i doradcze. Wyłapał potencjał na rynki anglojęzyczne i specyficzne nisze branżowe. Zaproponował kreatywne rozwiązania (np. kalkulator budżetu). Czyta się to trochę jak świetny pitch sprzedażowy dla klienta, ale miejscami brakuje mu precyzji w danych.
- Podejście Sonnet 4.6: Analityczne i operacyjne. Podał tabelkę z konkretnymi liczbami, wyłapał anomalie (np. kanibalizację crawl budgetu przez LinkedIn) i podał jasne estymacje efektów. Jest konkretny, łatwy do natychmiastowego wdrożenia przez zespół techniczny, ale pominął potencjał zagraniczny.
🏆 Zwycięzca Rundy 3: Remis.
Analiza Soneta to idealny dokument roboczy dla działu SEO. Analiza Gemini to świetny materiał strategiczny i prezentacja do pokazania klientowi. Idealnie byłoby połączyć strukturę Soneta z kreatywnością Gemini.
Dowód, że to naprawdę działa (Bonus!)
Żeby nie być gołosłownym – wygenerowany w teście (przez Soneta na podstawie briefu Soneta) artykuł opublikowaliśmy rano na naszej stronie.
Kiedy nagrywałem materiał wideo (o 13:00 tego samego dnia), ten wpis był już brany pod uwagę w Google AI Overviews i wylądował na 2. pozycji w wynikach wyszukiwania (zaraz za Profitroomem). Choć może to być chwilowy „freshness boost” dla nowej strony, fakt, że Google od razu potraktowało nas tak priorytetowo, dowodzi jednego: ta metoda generowania i optymalizacji treści po prostu działa.
Podsumowanie: W co inwestować w agencji?
Moim zdaniem obronną ręką z całego testu wychodzi Claude Sonnet 4.6. Jest precyzyjny, trzyma się wytycznych i stanowi niesamowite narzędzie operacyjne. W codziennej pracy wykorzystuję jego natywne funkcje (skille/projekty), które są znacznie bardziej uniwersalne i dokładne niż customowe Gemy od Google. Gdybym miał dziś przeznaczyć budżet na tylko jedno płatne narzędzie AI do agencji – wybrałbym Claude’a.
Z drugiej strony największym plusem Gemini 3.1 Pro jest to, że fantastycznie radzi sobie z pisaniem świetnych tekstów i doradztwem strategicznym, a dostęp do niego w Google AI Studio (lub poprzez Google Workspace) jest często w pełni darmowy. To ogromna wartość, która nie wymaga wyważania otwartych drzwi.
A Wy jakich modeli używacie w codziennej pracy? Zróbcie własne testy i podzielcie się wynikami!
PS. Pełne analizy, wygenerowane briefy i napisane teksty z tego eksperymentu znajdziecie w linkach poniżej. Pamiętajcie też, by śledzić naszego bloga i kanał na YouTube – w następnym materiale krok po kroku pokażę Wam, jak prawidłowo tworzyć Content Briefy, bo jak sami widzieliście, robią one gigantyczną różnicę.