Articles

podstawowy Url domeny vs. pełny Url ścieżki. Co za różnica?

szacowany czas odczytu: 5 minut

spis treści

Jaka jest różnica między domeną bazową a pełnym adresem URL ścieżki?

dla przeciętnego internauty pasek adresu URL zapewnia łatwy pasek wyszukiwania i „rozmyte” narzędzie dopasowujące—odsłaniające skarby Internetu po naciśnięciu przycisku „enter”.

dla tych z nas, którzy zajmują się IT, tworzeniem oprogramowania lub administracją siecią—wiemy, że staje się to znacznie bardziej skomplikowane. Szybko ześlizgujemy się do króliczej nory i do OSI, DNS, TLS, HTTPS, subdomen … ok. Skup się.

dla naszych partnerów w dziedzinie bezpieczeństwa sieci, filtrowania stron internetowych, technologii reklamowych i innych—istnieje krytyczne rozróżnienie między dwoma podstawowymi typami adresów URL: domenami bazowymi i adresami URL z pełną ścieżką.

szybkie odświeżanie adresów URL

jako krótkie odświeżanie, URL (Uniform Resource Locator) jest specyficznym podtypem URI (Uniform Resource Identifier)—wraz z URN (Uniform Resource Name). Jeśli jesteś zdezorientowany-nie jesteś sam. To skomplikowane i pewnie dlatego tu jesteś. Oto krótki podział elementów w adresie URL:

struktura pełnego Url ścieżki
struktura pełnego Url ścieżki

elementy adresu URL obejmują:
  • protokół (schemat)
  • subdomena
  • nazwa domeny
  • domena najwyższego poziomu (TLD)
  • ścieżka/ Plik (z rozszerzeniem)
  • parametry

aby uzyskać bardziej szczegółowe wyjaśnienie, sprawdź linki do notatek i odniesień na końcu tego bloga.

adresy URL domeny bazowej

domena bazowa jest parasolem, pod którym znajduje się cała witryna. Domena bazowa składa się tylko z dwóch elementów URL:

  1. nazwa domeny
  2. domena najwyższego poziomu (TLD)

Gdy użytkownik wprowadza domenę bazową w pasku adresu URL (tj. google.com, amazon.com, itp.), DNS kieruje je do lokalizacji IP serwera dla strony głównej danej witryny (konkretny adres, taki jak / index.htm lub /home.html).

dla celów kategoryzacji domenie podstawowej przypisana jest odpowiednia wartość kategorii, która jest reprezentatywna dla wszystkich stron i plików zawartych w witrynie. Domena bazowa i jej Odpowiednia wartość kategorii mogą być następnie przypisane do bazy danych URL, która może być buforowana na urządzeniu – w centrum danych, na komputerze lub dostępna za pośrednictwem chmury.

w świecie rzeczywistym, poprzez wdrożenie bazy danych kategoryzacji adresów URL, cały ruch internetowy można filtrować, chronić lub analizować w czasie rzeczywistym, odwołując się do buforowanej bazy danych adresów URL. Ale jaki poziom ziarnistości kategorii potrzebujesz?

pełne adresy URL ścieżek

natomiast pełny adres URL ścieżki odnosi się do dokładnej lokalizacji (np. strony, artykułu, pliku itp.).) i pozwala na wysoce specyficzną analizę i kategoryzację treści internetowych pod określonym adresem. Pełny URL ścieżki zawiera nie tylko domenę i TLD, musi również zawierać protokół (aka scheme), subdomenę (tj. blog, wsparcie itp.), ścieżka / miejsce docelowe i potencjalnie rozszerzenie pliku, a także parametry.

oznacza to, że może zawierać wszystkie następujące elementy:

  1. protokół
  2. subdomena
  3. nazwa domeny
  4. domena najwyższego poziomu (TLD)
  5. ścieżka/plik
  6. parametry (optymalne)

tylko przy wszystkich tych elementach można dokonać kompleksowej analizy w celu zidentyfikowania najbardziej odpowiedniej kategorii dla strony, postu itp. Z prawie dwoma (2) miliardami witryn w Internecie-z których każda może zawierać miliony indeksowanych stron-wymagałoby to dość dużego wymogu przechowywania danych (delikatnie mówiąc).

w celu kategoryzacji każda odwiedzana strona musiałaby zostać przeanalizowana i skategoryzowana z dużą dokładnością. Brzmi dość skomplikowanie? Tak.

w realnym świecie treści internetowe zmieniają się regularnie. Strony internetowe są umieszczane, są wycofywane, zmienia się treść, a świat ciągle się kręci-stanowi wyzwanie dla wysokiej dokładności na poziomie strony/postu/pliku. Oznacza to, że każda strona musi być regularnie analizowana i kategoryzowana (jeśli nie jest odwiedzana).

zvelo umożliwia kategoryzację stron w czasie niemal rzeczywistym, wykorzystując uczenie maszynowe i zaawansowane możliwości chmury zveloAI. Pomagamy naszym partnerom zidentyfikować ważne miejsca, zachowania i kategorie dla ich aplikacji, a także pomóc w określeniu przepływu pracy i infrastruktury wdrażania, która odpowiada ich potrzebom.

chcesz więcej informacji? Skontaktuj się z nami.

Podzielmy to

teraz, gdy przyjrzeliśmy się domenie podstawowej i pełnym adresom URL ścieżki, przyjrzyjmy się trochę temu, co to oznacza.

Weźmy na przykład domenę bazową, cnn.com strona internetowa. CNN może być skategoryzowana jako”wiadomości międzynarodowe”i” Streaming & do pobrania wideo ” (który jest przez nasze systemy). Ale to tylko zapewnia wysoką klasyfikację. CNN ma miliony stron i artykułów o wszystkim, począwszy od tenisa i Sportu, do polityki, do technologii.

Zvelolive wyniki kategoryzacji dla CNN.com

jedna kategoria (domena bazowa) w porównaniu z milionami (poszczególne strony i artykuły)? To ważne rozróżnienie-zwłaszcza jeśli chcesz sklasyfikować treści internetowe na bardzo szczegółowym poziomie-czy to do filtrowania stron internetowych w celu ochrony dzieci przed treściami budzącymi zastrzeżenia-czy do wydawcy reklam, który chce wyświetlać reklamy dezodorantu tylko na stronach fitness, sportowych i innych odpowiednich stronach.

staje się jeszcze trudniejsze dla serwisów społecznościowych, platform i wyszukiwarek takich jak facebook, reddit czy google. Aby osiągnąć wyższy poziom szczegółowości i dokładności dla określonej zawartości na każdej stronie / Pliku-musisz spojrzeć na pełną ścieżkę.

inne uwagi

w przypadku wielu aplikacji base domain zapewnia skuteczne, wysokopoziomowe i buforowalne (szybkie) rozwiązanie dla podstawowych funkcji filtrowania sieci (biała / czarna lista). Dla innych, szczególnie tych z zakresu cyberbezpieczeństwa, urządzeń sieciowych (routerów, bram itp.reklamy online-znaczenie kontekstowe ma kluczowe znaczenie dla zapewnienia ochrony i zrozumienia zachowań i intencji użytkowników.

dodając do poziomu złożoności, internet stale się zmienia—zarówno treść na stronach internetowych, jak i technologie łączące użytkowników z nimi. Nawet istniejąca zawartość może ulec zmianom i aktualizacjom.

Co więcej—złośliwe i niewłaściwe treści (rodzaje treści, nad którymi cyberbezpieczeństwo i reklama naprawdę chcą mieć pewną kontrolę) to typy treści, które najprawdopodobniej zmienią się wraz z nowymi domenami i stronami pojawiającymi się na krótki czas, aby służyć konkretnemu celowi—przed wycofaniem z użytku, aby zatrzeć ślady złych aktorów lub dlatego, że nie służą już celowi.

bądź na bieżąco, aby dowiedzieć się więcej na temat pełnych adresów URL ścieżek i kategoryzacji w czasie rzeczywistym. Jeśli chcesz uzyskać więcej informacji na temat kategoryzacji adresów URL dla poniższych aplikacji, zobacz poniższe linki. Jeśli chcesz porozmawiać z przedstawicielem lub umówić się na ocenę, odwiedź naszą stronę kontaktową.

aplikacje, które korzystają z kontroli i analizy przy pełnej ścieżce, obejmują:

  • filtrowanie sieci & Kontrola rodzicielska
  • wykrywanie złośliwych
  • Analiza Abonentów
  • Bezpieczeństwo marki & kierowanie kontekstowe

chcesz przetestować prowadź własne adresy URL z Zvelolive?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/