Articles

URL van het Basisdomein Versus URL van het volledige pad. Wat is het verschil?

geschatte Leestijd: 5 minuten

inhoudsopgave

Wat is het verschil tussen een basisdomein en een URL met volledig pad?

voor de gemiddelde websurfer biedt de URL-balk een eenvoudige zoekbalk en een “fuzzy” match-tool-die de schatten van het internet openbaart bij de slag van ‘enter’.

voor degenen onder ons in it-rollen, softwareontwikkeling of netwerkbeheer-we weten dat het veel ingewikkelder wordt. We glijden snel door het konijnenhol en in OSI, DNS, TLS, https, subdomeinen … ok. Richten.

voor onze partners in netwerkbeveiliging, webfiltering, ad tech, en meer—er is een kritisch onderscheid dat we maken tussen twee basistypen URL ‘s: Basisdomeinen en URL’ s met Volledig pad.

een snelle opfriscursus op URL ‘ s

als een korte opfriscursus is een URL (Uniform Resource Locator) een specifiek subtype van URI (Uniform Resource Identifier)—samen met URN (Uniform Resource Name). Als je in de war bent, ben je niet alleen. Het is ingewikkeld, en daarom ben je waarschijnlijk hier. Dus hier is een snelle uitsplitsing van de elementen binnen een URL:

structuur van een volledig pad URL
structuur van een volledig pad URL

elementen van een URL include:
  • Protocol (schema)
  • subdomein
  • domeinnaam
  • Top Level Domain (TLD)
  • pad/bestand (w/ extensie)
  • Parameters

voor een meer gedetailleerde uitleg, kijk op de notities en verwijzingen links aan het einde van deze blog.

Basisdomein-URL ‘ s

het basisdomein is de paraplu waaronder een hele site zich bevindt. Een basisdomein bestaat uit slechts twee URL-elementen:

  1. domeinnaam
  2. Top Level Domain (TLD)

wanneer een gebruiker een basisdomein invoert in de URL-balk (d.w.z. google.com, amazon.com, enz.), DNS stuurt ze naar de server IP-locatie voor de homepage van de respectieve website (een specifiek adres zoals /index.htm of / home.HTML).

voor categorisatiedoeleinden wordt aan het basisdomein een passende categoriewaarde toegekend die representatief is voor alle pagina ‘ s en bestanden op de website. Het basisdomein en de respectieve categoriewaarde kunnen vervolgens worden vastgelegd in een URL—database, die kan worden opgeslagen op een apparaat-in een datacenter, op een computer of toegankelijk via de cloud.

in de echte wereld kan door het implementeren van een URL-categorisatiedatabase al het internetverkeer in real-time worden gefilterd, beschermd of geanalyseerd door te verwijzen naar de URL-database in de cache. Maar welk niveau van categorie granulariteit heb je nodig?

URL ‘ s met Volledig pad

daarentegen verwijst een URL met volledig pad naar een exacte locatie (bijv. pagina, artikel, bestand, enz.) en zorgt voor een zeer specifieke analyse en categorisatie van webinhoud op het opgegeven adres. Een volledig pad URL bevat niet alleen het domein en TLD, het moet ook het protocol (aka schema), subdomein (d.w.z. blog, ondersteuning, etc.), pad / bestemming, en mogelijk een bestandsextensie, evenals parameters.

dat wil zeggen, het kan alle volgende elementen bevatten:

  1. Protocol
  2. subdomein
  3. domeinnaam
  4. Top Level Domain (TLD)
  5. pad/bestand
  6. Parameters (optimaal)

alleen met al deze elementen kan een uitgebreide analyse worden gemaakt om de meest relevante categorie voor de pagina, post, enz.te identificeren. Met bijna twee (2) miljard websites op het internet-elk in staat met inbegrip van miljoenen geïndexeerde pagina ‘ s-dat zou een vrij forse vereiste voor gegevensopslag vereisen (om het licht te zeggen).

voor categorisatiedoeleinden moet elke bezochte pagina met een hoge mate van nauwkeurigheid worden geanalyseerd en gecategoriseerd. Klinkt dat nogal ingewikkeld? Dat is het ook.

in de echte wereld verandert de inhoud van het web regelmatig. Websites worden opgezet, zijn gepensioneerd, de inhoud verandert, en de wereld blijft draaien—die een uitdaging vormen voor hoge nauwkeurigheid op het niveau van pagina/post/bestand. Dat betekent dat elke pagina regelmatig moet worden geanalyseerd en gecategoriseerd (zo niet als het wordt bezocht).

zvelo bereikt bijna real-time categorisatie op paginaniveau door gebruik te maken van machine learning en de geavanceerde mogelijkheden van de Zveloai Cloud. We helpen onze partners bij het identificeren van de belangrijke sites, gedragingen en categorieën voor hun applicatie—en helpen een workflow en implementatieinfrastructuur te schetsen die bij hun behoeften past.

wilt u meer informatie? Neem contact met ons op.

laten we het opsplitsen

nu we hebben gekeken naar Basisdomein en en volledige pad URL ‘ s, laten we een beetje verkennen over wat dat betekent.

laten we een basisdomein nemen, bijvoorbeeld, cnn.com. CNN ’s website kan worden gecategoriseerd als’ International News ‘en’ Streaming & downloadbare Video ‘ (wat het is door onze systemen). Maar dat levert alleen een classificatie op hoog niveau op. CNN heeft miljoenen pagina ‘ s en artikelen over alles, van Tennis en sport, tot politiek, tot technologie.

zveloLIVE Categorisatieresultaten voor CNN.com

één categorie (het basisdomein) vergeleken met miljoenen (de afzonderlijke pagina ‘ s en artikelen)? Dat is een belangrijk onderscheid—vooral als u op zoek bent naar het classificeren van webinhoud op een zeer korrelig niveau—of het nu voor webfiltering om kinderen te beschermen tegen aanstootgevende Inhoud—of een advertentieuitgever die advertenties voor deodorant wil weergeven alleen op fitness, sport en andere relevante pagina ‘ s.

het wordt nog moeilijker voor de kolos sociale netwerken, platforms en zoekmachines zoals facebook, reddit, of google. Om een hoger niveau van granulariteit en nauwkeurigheid te bereiken voor de specifieke inhoud op elke pagina/Bestand—je nodig hebt om te kijken naar het volledige pad.

andere overwegingen

voor veel toepassingen biedt base domain een effectieve high-level en cacheable (high-speed) oplossing voor basis webfiltering (whitelisting / blacklisting) mogelijkheden. Voor anderen, met name die in cybersecurity, netwerkapparaten (routers, gateways, enz.), en online adverteren-contextuele relevantie is van cruciaal belang voor het bieden van bescherming en het begrijpen van gebruikersgedrag en intentie.

het internet wordt steeds complexer en verandert voortdurend—zowel de inhoud op webpagina ’s als de technologieën die gebruikers met deze pagina’ s verbinden. Zelfs bestaande inhoud is onderhevig aan wijzigingen en updates.

wat meer is—kwaadaardige en verwerpelijke inhoud (de soorten inhoud waarover cybersecurity en reclame echt enige controle willen hebben) zijn de inhoudstypen die het meest waarschijnlijk zullen veranderen met nieuwe domeinen en pagina ‘ s die voor korte tijd verschijnen om een specifiek doel te dienen—voordat ze worden ontmanteld om de sporen van slechte acteurs uit te wissen of omdat het niet langer een doel dient.

stay tuned voor meer informatie over volledige pad-URL ‘ s en real-time categorisatie. Als u geïnteresseerd bent in meer informatie over url categorisatie voor een van de volgende toepassingen, zie de links hieronder. Als u geïnteresseerd bent in het spreken met een vertegenwoordiger of het plannen van een evaluatie, bezoek onze Contact pagina.

toepassingen die profiteren van controle en analyse op het volledige pad zijn onder meer:

  • webfiltering & Ouderlijk toezicht
  • kwaadaardige detectie
  • Subscriber Analytics
  • Brand Safety & contextuele Targeting

Want om te testen sommige URL ‘ s van uw eigen met zvelolive?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/