Articles

Basisdomänen-URL vs. Vollständige Pfad-URL. Was ist der Unterschied?

Geschätzte Lesezeit: 5 Minuten

Inhaltsverzeichnis

Was ist der Unterschied zwischen einer Basisdomäne und einer vollständigen Pfad-URL?

Für den durchschnittlichen Websurfer bietet die URL—Leiste eine einfache Suchleiste und ein „Fuzzy“ -Match-Tool, das die Schätze des Internets auf Knopfdruck enthüllt.

Für diejenigen von uns in IT—Rollen, Softwareentwicklung oder Netzwerkadministration – wir wissen, dass es viel komplizierter wird. Wir schlüpfen schnell in das Kaninchenloch und in OSI, DNS, TLS, HTTPS, Subdomains … ok. Fokus.

Für unsere Partner in den Bereichen Netzwerksicherheit, Webfilterung, Werbetechnik und mehr gibt es eine kritische Unterscheidung zwischen zwei grundlegenden Urltypen: Basisdomänen und URLs mit vollem Pfad.

Eine kurze Auffrischung von URLs

Als kurze Auffrischung ist eine URL (Uniform Resource Locator) ein spezifischer Subtyp von URI (Uniform Resource Identifier) — zusammen mit URN (Uniform Resource Name). Wenn Sie verwirrt sind – Sie sind nicht allein. Es ist kompliziert, und deshalb bist du wahrscheinlich hier. Hier ist also eine kurze Aufschlüsselung der Elemente innerhalb einer URL:

Struktur einer vollständigen Pfad-URL
Struktur einer vollständigen Pfad-URL

Elemente einer URL:
  • Protokoll (Schema)
  • Subdomain
  • Domainname
  • Top Level Domain (TLD)
  • Pfad / Datei (mit Erweiterung)
  • Parameter

Eine detailliertere Erklärung finden Sie in den Hinweisen und Referenzen am Ende dieses Blogs.

Basisdomänen-URLs

Die Basisdomäne ist das Dach, unter dem sich eine gesamte Site befindet. Eine Basisdomäne besteht nur aus zwei URL-Elementen:

  1. Domainname
  2. Top Level Domain (TLD)

Wenn ein Benutzer eine Basisdomäne in die URL-Leiste eingibt (z. google.com, amazon.com , etc.), DNS leitet sie an die Server-IP-Adresse für die Homepage der jeweiligen Website (eine bestimmte Adresse wie / index.htm oder /home.HTML).

Zu Kategorisierungszwecken wird der Basisdomäne ein geeigneter Kategoriewert zugewiesen, der für alle Seiten und Dateien auf der Website repräsentativ ist. Die Basisdomäne und ihr jeweiliger Kategoriewert können dann an eine URL-Datenbank übergeben werden, die auf einem Gerät zwischengespeichert werden kann — in einem Rechenzentrum, auf einem Computer oder über die Cloud.In der realen Welt kann durch die Implementierung einer URL-Kategorisierungsdatenbank der gesamte Internetverkehr in Echtzeit gefiltert, geschützt oder analysiert werden, indem auf die zwischengespeicherte URL-Datenbank verwiesen wird. Aber welches Maß an Kategoriegranularität benötigen Sie?

Vollständige Pfad-URLs

Im Gegensatz dazu bezieht sich eine vollständige Pfad-URL auf einen GENAUEN Speicherort (z. B. Seite, Artikel, Datei usw.) und ermöglicht eine hochspezifische Analyse und Kategorisierung von Webinhalten unter der angegebenen Adresse. Eine vollständige Pfad-URL enthält nicht nur die Domain und die TLD, sondern auch das Protokoll (aka Schema), die Subdomain (d. H. blog, Unterstützung, etc.), Pfad/Ziel und möglicherweise eine Dateierweiterung sowie Parameter.Das heißt, es kann alle folgenden Elemente enthalten:

  1. Protokoll
  2. Subdomain
  3. Domainname
  4. Top Level Domain (TLD)
  5. Pfad/Datei
  6. Parameter (optimal)

Nur mit all diesen Elementen kann eine umfassende Analyse durchgeführt werden, um die relevanteste Kategorie für die Seite, den Beitrag usw. zu identifizieren. Mit fast zwei (2) Milliarden Websites im Internet – von denen jede Millionen indizierter Seiten enthalten kann – würde dies einen ziemlich hohen Datenspeicherbedarf erfordern (um es leicht auszudrücken).

Zur Kategorisierung müsste jede einzelne besuchte Seite mit hoher Genauigkeit analysiert und kategorisiert werden. Klingt ziemlich kompliziert? Ist es.

In der realen Welt ändern sich Webinhalte regelmäßig. Websites werden eingerichtet, sind im Ruhestand, Inhalt ändert sich, und die Welt dreht sich weiter — eine Herausforderung für die hohe Genauigkeit auf Seiten- / Post- / Dateiebene. Das bedeutet, dass jede Seite regelmäßig analysiert und kategorisiert werden muss (wenn nicht so, wie sie besucht wird).

zvelo erreicht die Kategorisierung auf Seitenebene nahezu in Echtzeit, indem maschinelles Lernen und die erweiterten Funktionen der zveloAI-Cloud genutzt werden. Wir helfen unseren Partnern, die wichtigen Standorte, Verhaltensweisen und Kategorien für ihre Anwendung zu identifizieren und einen Workflow und eine Bereitstellungsinfrastruktur zu skizzieren, die ihren Anforderungen entsprechen.

Möchten Sie mehr Informationen? Kontaktieren Sie uns.

Lassen Sie es uns aufschlüsseln

Nachdem wir uns nun die Basisdomäne und die vollständigen Pfad-URLs angesehen haben, wollen wir ein wenig darüber nachdenken, was das bedeutet.

Nehmen wir zum Beispiel eine Basisdomäne, cnn.com . CNNs Website könnte als „Internationale Nachrichten“ und „Streaming & Herunterladbares Video“ kategorisiert werden (was es von unseren Systemen ist). Aber das bietet nur eine High-Level-Klassifizierung. CNN hat Millionen von Seiten und Artikeln über alles, von Tennis und Sport über Politik bis hin zu Technologie.

zveloLIVE Kategorisierungsergebnisse für CNN.com

Eine Kategorie (die Basisdomain) im Vergleich zu Millionen (die einzelnen Seiten und Artikel)? Dies ist eine wichtige Unterscheidung — insbesondere, wenn Sie Webinhalte auf einer sehr detaillierten Ebene klassifizieren möchten – sei es für die Webfilterung, um Kinder vor anstößigen Inhalten zu schützen — oder für einen Anzeigenherausgeber, der Werbung für Kinder nur auf Fitness-, Sport- und anderen relevanten Seiten anzeigen möchte.

Es wird noch schwieriger für die Behemoth soziale Netzwerke, Plattformen und Suchmaschinen wie Facebook, reddit oder Google. Um eine höhere Granularität und Genauigkeit für den spezifischen Inhalt jeder Seite / Datei zu erreichen, müssen Sie den vollständigen Pfad anzeigen.

Weitere Überlegungen

Für viele Anwendungen bietet Base Domain eine effektive High-Level- und cachefähige (Hochgeschwindigkeits-) Lösung für grundlegende Webfilterfunktionen (Whitelisting/Blacklisting). Für andere, insbesondere im Bereich Cybersicherheit, Netzwerkgeräte (Router, Gateways usw.), und Online—Werbung – kontextbezogene Relevanz ist entscheidend für den Schutz und das Verständnis des Nutzerverhaltens und der Absicht.

Zusätzlich zur Komplexität verändert sich das Internet ständig — sowohl der Inhalt von Webseiten als auch die Technologien, die Benutzer mit ihnen verbinden. Auch bestehende Inhalte unterliegen Änderungen und Aktualisierungen.Was mehr ist — bösartige und anstößige Inhalte (die Arten von Inhalten, über die Cybersicherheit und Werbung wirklich eine gewisse Kontrolle haben wollen) sind die Inhaltstypen, die sich am ehesten ändern, wenn neue Domains und Seiten für kurze Zeit auftauchen, um einen bestimmten Zweck zu erfüllen — bevor sie außer Betrieb genommen werden, um die Spuren schlechter Schauspieler zu verwischen oder weil sie keinen Zweck mehr erfüllen.

Bleiben Sie dran, um mehr über vollständige Pfad-URLs und Echtzeit-Kategorisierung zu erfahren. Wenn Sie an weiteren Informationen zur URL-Kategorisierung für eine der folgenden Anwendungen interessiert sind, lesen Sie bitte die folgenden Links. Wenn Sie daran interessiert sind, mit uns zu sprechen oder eine Bewertung zu planen, besuchen Sie unsere Kontaktseite.

Zu den Anwendungen, die von der Kontrolle und Analyse auf dem vollständigen Pfad profitieren, gehören:

  • Webfilterung & Kindersicherung
  • Böswillige Erkennung
  • Abonnentenanalyse
  • Markensicherheit & Kontextbezogenes Targeting

Möchten Sie einige eigene URLs mit zveloLIVE?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/