SiteFocusScore, SiteRadius i topical authority – jak Google mierzy spójność tematyczną

Artykuły SEO

Topical authority nie jest „cechą treści”. To własność całego systemu dokumentów, oceniana relacyjnie – względem siebie i względem zapytań, a nawet następujących po nich zachowań użytkowników.

Wyciek dokumentacji Google (Warehouse API) nie „potwierdza” istnienia topical authority jako jednego sygnału rankingowego. Pokazuje coś ważniejszego: jak algorytmicznie mierzy się koncentrację tematyczną serwisu oraz odchylenia poszczególnych dokumentów od rdzenia tematycznego.

Dwie metryki, które to ilustrują, to:

  • SiteFocusScore
  • SiteRadius

Nie są to metryki SEO „do optymalizacji”. To elementy systemu oceny spójności i specjalizacji źródła.

sitefocus i siteradius względem centroidu

SiteFocusScore i SiteRadius – co faktycznie mierzą

SiteFocusScore – koncentracja tematyczna systemu treści

SiteFocusScore opisuje, jak silnie treści serwisu skupiają się wokół jednego obszaru semantycznego.

Nie chodzi o:

  • częstotliwość słów kluczowych (keyword stuffing),
  • ręcznie przypisane kategorie,
  • deklaracje tematyczne na stronie „O nas”.

Chodzi o wektorową zbieżność znaczeń pomiędzy dokumentami w obrębie domeny.

Im większa spójność:

  • pojęciowa,
  • encyjna,
  • intencyjna,

tym wyższy SiteFocusScore.

To metryka na poziomie całej domeny, a nie pojedynczej strony.

SiteRadius – odchylenie pojedynczych dokumentów

SiteRadius działa odwrotnie.

Mierzy:

  • jak daleko dana podstrona „oddala się” semantycznie od rdzenia tematycznego witryny,
  • czy dokument wzmacnia, czy rozmywa główny temat.

Wysoki SiteRadius = treść:

  • przypadkowa,
  • oportunistyczna,
  • pisana „bo jest keyword”.

Nie musi być zła jakościowo.
Wystarczy, że nie pasuje do wektora tematycznego całości.

Jak Google to liczy – embeddings zamiast słów

Pytanie „skąd algorytm wie, że coś jest blisko lub daleko tematycznie?” jest źle postawione.

Google nie porównuje tematów opisowo.
Porównuje reprezentacje wektorowe znaczenia.

W dokumentacji wprost pojawiają się pojęcia:

  • pageEmbeddings – wektor znaczeniowy dokumentu,
  • siteEmbeddings – zagregowany wektor znaczeniowy całej witryny.

Relacja między nimi liczona jest matematycznie (np. odległość cosinusowa).

To oznacza jedno:

  • topical authority nie jest opinią algorytmu,
  • jest wynikiem obliczeń w przestrzeni semantycznej.

Po co Google mierzy koncentrację tematyczną

Nie po to, żeby „karać blogi wielotematyczne”.

Tylko po to, żeby odpowiedzieć na kluczowe pytania systemowe:

  • Czy ten byt / encja (autor, marka, redakcja) realnie specjalizuje się w danym obszarze?
  • Które dokumenty należą do tej specjalizacji, a które są peryferyjne?
  • Czy serwis może być traktowany jako stabilne źródło wiedzy, czy tylko zbiór przypadkowych treści?

To dane wykorzystywane:

  • w rankingu,
  • w indeksacji,
  • w retrievalu (szczególnie LLM/AI Overviews),
  • w systemach jakościowych.

Topical authority to efekt uboczny spójnego systemu treści, nie osobna metryka do „podbijania”.

Topical authority a zachowania użytkowników

Google wielokrotnie przyznawało (również w zeznaniach przed DOJ), że:

  • predykcje jakości są niepewne,
  • zachowania użytkowników służą do walidacji.

źródło: https://hexdocs.pm/google_api_content_warehouse/api-reference.html

Ale to drugi etap.

Najpierw musi powstać zbiór kandydatów:

  • dokumentów,
  • źródeł,
  • bytów.

Nie da się tego zrobić wyłącznie na keyword match.

Dlatego:

  • SiteFocusScore,
  • SiteRadius,
  • spójność encyjna,

są potrzebne jako filtr wstępny.

Ważny kontekst: topical authority często bywa rozumiane także jako pełne pokrycie pewnej dziedziny w praktycznym kontekście konkretnej intencji oraz bytu, który ją zaspokaja (brand jako tzw. source context), które jest dodatkowo potwierdzone przez użytkowników (poprzez zachowania wskazujące na satysfakcjonujące sesje z Google). Tak to jest tłumaczone we frameworku Koraya Tugberka Gubura:

topical authority = topical coverage x user signals

To bardzo ważny dodatek do całej układanki, ponieważ wielu twórców stron masowo produkuje content, który jest tematycznie zbieżny, ale totalnie nieużyteczny. Po chwilowych wzrostach, zwykle takie strony tracą widoczność przy najbliższym core update. Dlatego tak ważne, aby content marki, nawet jeśli tworzony przez AI, był unikalny dla tejże marki, użyteczny i prowadził do dalszych kroków.

Dlaczego „pokrycie tematu” działa – ale nie tak, jak myśli branża

Nie chodzi o:

  • liczbę artykułów,
  • „kompletność encyklopedyczną”.

Chodzi o to, czy:

  • rdzeń tematyczny jest jasno zdefiniowany,
  • wszystkie dokumenty wzmacniają ten sam wektor znaczeniowy,
  • treści poboczne są osadzone kontekstowo, a nie autonomiczne.

Przykład:

Jeśli sprzedajesz żyrandole:

  • piszesz o typach żyrandoli,
  • montażu,
  • doborze do wnętrza,
  • porównaniach.

Nie piszesz ogólnych porad o aranżacji wnętrz jako osobnego tematu.
Możesz o tym wspomnieć wyłącznie w relacji do żyrandoli.

To różnica między:

  • rozszerzaniem topical map,
  • a zwiększaniem SiteRadius.

EffortScore, ChardScores i problem treści „łatwych”

W wycieku pojawiają się też sygnały oceny wysiłku i użyteczności, m.in.:

  • EffortScore – wysiłek włożony w stworzenie treści (jak bardzo różni się od ściany generycznego tekstu wygenerowanego przez AI na zadany temat na podstawie danych treningowych),
  • ChardScores – świeżość + zaangażowanie użytkowników.

To ważne, bo pokazuje ograniczenie:

topical authority nie da się zbudować niskim kosztem poznawczym.

Treści:

  • generyczne,
  • łatwe do wygenerowania przez LLM,
  • pozbawione information gain,

mogą chwilowo „zagrać”, ale:

  • nie stabilizują SiteFocusScore,
  • nie bronią się w długim okresie,
  • wypadają przy aktualizacjach jakościowych.

Dlatego:

  • content pruning,
  • aktualizacja (szczególnie w przypadku treści targetujących zapytania z wysokim QDF)
  • realna użyteczność,

są elementem utrzymania topical authority, nie tylko jego budowy.

Topical authority – skala czy próg?

Praktycznie: to nie jest liniowa skala.

Bardziej przypomina próg decyzyjny:

  • albo jesteś traktowany jako źródło tematyczne,
  • albo nie.

Wewnątrz tego pola:

  • konkurujesz jakością,
  • spójnością,
  • głębokością rozumienia intencji.

Nie wystarczy „pisać o wszystkim w temacie”.
Kluczowe jest precyzyjne osadzenie w jednym głównym entity.

Bardzo możliwe, że:

  • strona główna,
  • architektura informacji,
  • kontekst brandowy,

odgrywają tu rolę nadrzędną.

Architektura treści jako system decyzyjny

Huby tematyczne, silosy, klastry – to nie są „struktury SEO”.

To:

  • sposób ograniczania SiteRadius,
  • sposób wzmacniania SiteFocusScore,
  • sposób prowadzenia użytkownika przez logiczne ścieżki decyzyjne.

Linkowanie wewnętrzne nie służy robotom.
Służy utrzymaniu spójności poznawczej:

  • dla użytkownika,
  • dla systemów retrievalu,
  • dla LLM, które konsumują treść fragmentarycznie.

CTA, kolejność treści, zależności między dokumentami – to część tego samego systemu.

Dlaczego słabsze domeny wygrywają z „mocniejszymi”

Jeśli widzisz serwis:

  • z mniejszym profilem linkowym,
  • bez „brandu” w Ahrefsie,
  • a jednak dominujący w danym obszarze,

to bardzo często:

  • ma lepszy SiteFocusScore,
  • niższy SiteRadius,
  • lepiej dopasowane intencje.

Linki nadal mają znaczenie.
Ale kontekstowość (również kontekst linków) potrafi zrównoważyć różnice ilościowe.Wnioski operacyjne (bez checklist)

  • Myśl o topical authority jako o własności systemu, nie treści.
  • Zawężaj temat, zamiast go rozszerzać.
  • Traktuj architekturę informacji jako narzędzie kontroli semantycznej.
  • Usuwaj lub konsoliduj treści zwiększające SiteRadius.
  • Aktualizuj i pogłębiaj to, co wzmacnia rdzeń tematyczny.
  • Nie próbuj „skalować” topical authority automatyzacją.

SEO, AI Overviews i LLM retrieval działają na tej samej logice.
Jeśli system treści jest spójny poznawczo, będzie działał we wszystkich warstwach organicznego discovery.

Topical authority nie jest mitem.
Jest efektem ubocznym dobrze zaprojektowanego systemu wiedzy.

Udostępnij ten post:

    Let's talk about SEO!

    This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.