Articles

bas domän URL vs. Full sökväg URL. Vad är skillnaden?

Beräknad Lästid: 5 minuter

Innehållsförteckning

vad är skillnaden mellan en basdomän och fullständig webbadress?

För Den genomsnittliga webbsurfaren ger URL-fältet ett enkelt sökfält och” fuzzy ”matchverktyg—avslöjar skatterna på internet med ”enter”.

för oss i IT-roller, mjukvaruutveckling eller nätverksadministration—vi vet att det blir mycket mer komplicerat. Vi glider snabbt ner i kaninhålet och in i OSI, DNS, TLS, HTTPS, underdomäner… ok. Fokusera.

för våra partners inom nätverkssäkerhet, webbfiltrering, annonsteknik och mer—det finns en kritisk skillnad som vi gör mellan två grundläggande typer av webbadresser: basdomäner och fullständiga webbadresser.

en snabb uppdatering på webbadresser

som en kort uppdatering är en URL (Uniform Resource Locator) en specifik undertyp av URI (Uniform Resource Identifier)—tillsammans med URN (Uniform Resource Name). Om du är förvirrad-du är inte ensam. Det är komplicerat, och det är nog därför du är här. Så här är en snabb uppdelning av elementen inom en URL:

struktur för en fullständig sökväg URL
struktur för en fullständig sökväg URL

element i en URL inkluderar:
  • protokoll (schema)
  • underdomän
  • domännamn
  • toppdomän (TLD)
  • sökväg/ fil (w/extension)
  • parametrar

för en mer detaljerad förklaring, kolla in noterna och referenslänkarna i slutet av den här bloggen.

Basdomänadresser

basdomänen är det paraply under vilket en hel webbplats finns. En basdomän består av endast två av URL-elementen:

  1. domännamn
  2. toppdomän (TLD)

När en användare går in i en basdomän i URL-fältet (dvs. google.com, amazon.com, etc.), Leder DNS dem till serverns IP-plats för hemsidan för respektive webbplats (en specifik adress som /index.htm eller / hem.HTML).

för kategoriseringsändamål tilldelas basdomänen ett lämpligt kategorivärde som är representativt för alla sidor och filer som finns på webbplatsen. Basdomänen och dess respektive kategorivärde kan sedan begås till en URL-databas, som kan cachas på en enhet—i ett datacenter, på en dator eller tillgänglig via molnet.

i den verkliga världen kan all Internettrafik filtreras, skyddas eller analyseras i realtid genom att referera till den cachade URL-databasen genom att implementera en URL-kategoriseringsdatabas. Men vilken nivå av kategori granularitet behöver du?

fullständiga Sökvägsadresser

däremot hänvisar en fullständig sökvägsadress till en exakt plats (dvs. sida, artikel, fil etc.) och möjliggör en mycket specifik analys och kategorisering av webbinnehåll på den angivna adressen. En fullständig sökvägsadress innehåller inte bara domänen och toppdomänen, den måste också innehålla protokollet (aka-schema), underdomän (dvs. blogg, support osv.), sökväg / destination och eventuellt ett filtillägg samt parametrar.

det vill säga det kan innehålla alla följande:

  1. protokoll
  2. underdomän
  3. domännamn
  4. toppdomän (TLD)
  5. sökväg/fil
  6. parametrar (optimal)

endast med alla dessa element kan en omfattande analys göras för att identifiera den mest relevanta kategorin för sidan, inlägget etc. Med nästan två (2) miljarder webbplatser på internet—var och en som kan inkludera miljontals indexerade sidor—skulle det kräva ett ganska stort datalagringskrav (för att uttrycka det lätt).

för kategoriseringsändamål måste varje enskild sida som besöks analyseras och kategoriseras med hög grad av noggrannhet. Låter ganska komplicerat? Det är det.

i den verkliga världen ändras webbinnehåll regelbundet. Webbplatser sätts upp, är pensionerade, innehållsförändringar och världen fortsätter att snurra—utgör en utmaning för hög noggrannhet på sidan/post/filnivå. Det innebär att varje sida måste analyseras och kategoriseras regelbundet (om inte som den besöks).

zvelo uppnår nära realtid, sidnivåkategorisering genom att utnyttja maskininlärning och de avancerade funktionerna i zveloAI-molnet. Vi hjälper våra partners att identifiera viktiga webbplatser, beteenden och kategorier för deras tillämpning—och hjälper till att beskriva ett arbetsflöde och distributionsinfrastruktur som passar deras behov.

Vill du ha mer information? Kontakta oss.

Låt oss bryta ner det

Nu när vi har tittat på basdomän och och fullständiga Sökvägsadresser, låt oss utforska lite om vad det betyder.

Låt oss ta en basdomän, till exempel, cnn.com. CNNs webbplats kan kategoriseras som ”internationella nyheter”och”Streaming & nedladdningsbar Video ” (som det är av våra system). Men det ger bara en klassificering på hög nivå. CNN har miljontals sidor och artiklar om allt från Tennis och sport, till politik, till teknik.

Zvelolive Kategoriseringsresultat för CNN.com

en kategori (basdomänen) jämfört med miljoner (De enskilda sidorna och artiklarna)? Det är en viktig skillnad-särskilt om du vill klassificera webbinnehåll på en mycket detaljerad nivå—oavsett om det gäller webbfiltrering för att skydda barn från stötande innehåll—eller en annonsutgivare som bara vill visa annonser för deodorant på fitness, Sport och andra relevanta sidor.

det blir ännu svårare för behemoth sociala nätverk, plattformar och sökmotorer som facebook, reddit eller google. För att uppnå en högre nivå av granularitet och noggrannhet för det specifika innehållet på varje sida/fil—måste du titta på hela sökvägen.

andra överväganden

För många applikationer ger base domain en effektiv hög nivå och cacheable (höghastighets) lösning för grundläggande webbfiltrering (vitlistning/svartlistning) kapacitet. För andra, särskilt de inom cybersäkerhet, nätverksenheter (routrar, gateways, etc.), och onlineannonsering—kontextuell relevans är avgörande för att ge skydd och förstå användarbeteende och avsikt.

lägga till graden av komplexitet, är internet ständigt förändras—både innehållet på webbsidor och teknik som förbinder användare till dem. Även befintligt innehåll kan ändras och uppdateras.

Dessutom—skadligt och stötande innehåll (de typer av innehåll som cybersäkerhet och reklam verkligen vill ha viss kontroll över) är de innehållstyper som sannolikt kommer att förändras med nya domäner och sidor som dyker upp under korta perioder för att tjäna ett specifikt syfte—innan de avvecklas för att täcka spåren av dåliga aktörer eller för att det inte längre tjänar ett syfte.

Håll dig uppdaterad för mer information om fullständiga webbadresser och kategorisering i realtid. Om du är intresserad av mer information om URL-kategorisering för följande applikationer, se länkarna nedan. Om du är intresserad av att prata med representant eller schemalägga en utvärdering, besök vår kontaktsida.

program som drar nytta av kontroll och analys på den fullständiga sökvägen inkluderar:

  • webbfiltrering & Föräldrakontroll
  • skadlig upptäckt
  • Abonnentanalys
  • brandsäkerhet & kontextuell inriktning

vill du testa köra några egna webbadresser med zvelolive?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/