Articles

adresa URL a domeniului de bază vs. adresa URL a căii complete. Care e diferența?

timp estimat de citire: 5 minute

cuprins

care este diferența dintre un domeniu de bază și adresa URL a căii complete?

pentru surfer web medie, bara de URL—ul oferă o bară de căutare ușor și „fuzzy” instrument meci-dezvăluie comorile de pe internet la accident vascular cerebral de „enter”.

pentru aceia dintre noi în roluri IT, dezvoltare de software sau administrare de rețea—știm că devine mult mai complicat. Alunecăm rapid în gaura de iepure și în OSI, DNS, TLS, HTTPS, subdomenii… ok. Concentrează-te.

pentru partenerii noștri în securitatea rețelei, filtrarea web, tehnologia publicitară și multe altele—există o distincție critică pe care o facem între două tipuri de adrese URL de bază: domenii de bază și adrese URL cu cale completă.

o reîmprospătare rapidă a adreselor URL

ca o scurtă reîmprospătare, un URL (Uniform Resource Locator) este un subtip specific de URI (Uniform Resource Identifier)—împreună cu URN (Uniform Resource Name). Dacă ești confuz—nu ești singur. E complicat și probabil de asta ești aici. Deci, aici este o defalcare rapidă a elementelor dintr-un URL:

structura unui URL cale completă
structura unui URL cale completă

structura unui URL cale completă
elementele unei adrese URL includ:

  • Protocol (schemă)
  • subdomeniu
  • nume de domeniu
  • domeniu de nivel superior (TLD)
  • cale/ fișier (cu extensie)
  • parametri

pentru o explicație mai detaliată, consultați linkurile note și referințe de la sfârșitul acestui blog.

URL-uri de domeniu de bază

domeniul de bază este umbrela sub care se află un întreg site. Un domeniu de bază este format din doar două dintre elementele URL:

  1. nume de domeniu
  2. domeniu de nivel superior (TLD)

atunci când un utilizator introduce un domeniu de bază în bara URL (adică. google.com, amazon.com, etc.), DNS le direcționează către locația IP a serverului pentru pagina de pornire a site-ului respectiv (o adresă specifică, cum ar fi /index.htm sau / acasă.html).

în scopuri de clasificare, domeniului de bază i se atribuie o valoare de categorie corespunzătoare, care este reprezentativă pentru toate paginile și fișierele conținute în site. Domeniul de bază și valoarea categoriei respective pot fi apoi angajate într—o bază de date URL, care poate fi memorată în cache pe un dispozitiv-într-un centru de date, pe un computer sau accesibilă prin cloud.

în lumea reală, prin implementarea unei baze de date de clasificare URL, tot traficul de internet poate fi filtrat, protejat sau analizat în timp real prin referirea la baza de date URL cache. Dar ce nivel de granularitate de categorie aveți nevoie?

URL-uri de cale completă

în schimb, o adresă URL de cale completă se referă la o locație exactă (adică pagină, articol, fișier etc.) și permite o analiză foarte specifică și clasificarea conținutului web la adresa specificată. O adresă URL de cale completă nu numai că include domeniul și TLD, ci trebuie să includă și protocolul( aka schema), subdomeniul (adică. blog, suport,etc.), cale/destinație și, eventual, o extensie de fișier, precum și parametri.

adică poate include toate următoarele:

  1. Protocol
  2. subdomeniu
  3. nume de domeniu
  4. domeniu de nivel superior (TLD)
  5. cale/fișier
  6. parametri (optimali)

numai cu toate aceste elemente se poate face o analiză cuprinzătoare pentru a identifica categoria Cea mai relevantă pentru pagină, postare etc. Cu aproape două (2) miliarde de site—uri web pe internet—fiecare capabil să includă milioane de pagini indexate-asta ar necesita o cerință destul de mare de stocare a datelor (pentru a o pune ușor).

în scopuri de clasificare, fiecare pagină vizitată trebuie analizată și clasificată cu un grad ridicat de precizie. Sună destul de complicat? Este.

în lumea reală, conținutul web se schimbă în mod regulat. Site—urile web sunt puse, sunt retrase, conținutul se schimbă, iar lumea continuă să se învârtă-reprezentând o provocare pentru o precizie ridicată la nivel de pagină/post/fișier. Asta înseamnă că fiecare pagină trebuie analizată și clasificată în mod regulat (dacă nu așa cum este vizitată).

zvelo realizează aproape în timp real, Clasificarea la nivel de pagină prin utilizarea de învățare mașină și capacitățile avansate ale zveloAI Cloud. Îi ajutăm pe partenerii noștri să identifice site—urile, comportamentele și categoriile importante pentru aplicația lor-și ajutăm la conturarea unui flux de lucru și a unei infrastructuri de implementare care se potrivește nevoilor lor.

vrei mai multe informații? Contactați-ne.

să-l rupe în jos

acum, că ne-am uitat la domeniul de bază și și URL-uri cale completă, să exploreze un pic despre ce înseamnă asta.

să luăm un domeniu de bază, de exemplu, cnn.com.site-ul CNN ar putea fi clasificat ca”știri internaționale”și” Streaming & video descărcabil ” (care este de sistemele noastre). Dar asta oferă doar o clasificare la nivel înalt. CNN are milioane de pagini și articole despre tot, de la tenis și sport, la politică, la tehnologie.

rezultatele clasificării zveloLIVE pentru CNN.com

o categorie (domeniul de bază) în comparație cu milioane (paginile individuale și articole)? Aceasta este o distincție importantă—mai ales dacă doriți să clasificați conținutul web la un nivel foarte granular—fie pentru filtrarea web pentru a proteja copiii de conținutul inacceptabil—fie pentru un editor de anunțuri care dorește să afișeze reclame pentru deodorant numai pe fitness, sport și alte pagini relevante.devine și mai dificil pentru rețelele sociale, platformele și motoarele de căutare precum facebook, reddit sau google. Pentru a obține un nivel mai ridicat de granularitate și precizie pentru conținutul specific de pe fiecare pagină/fișier—trebuie să vă uitați la calea completă.

alte considerații

pentru multe aplicații, domeniul de bază oferă o soluție eficientă la nivel înalt și cacheable (de mare viteză) pentru filtrarea web de bază (Lista albă / Lista neagră) capabilități. Pentru alții, în special cei din securitate cibernetică, dispozitive de rețea (routere, gateway-uri etc.) și publicitate online—relevanța contextuală este esențială pentru asigurarea protecției și înțelegerea comportamentului și intenției utilizatorilor.

adăugând la nivelul de complexitate, Internetul este în continuă schimbare—atât conținutul de pe paginile web, cât și tehnologiile care conectează utilizatorii la acestea. Chiar și conținutul existent poate fi modificat și actualizat.mai mult, conținutul rău intenționat și inacceptabil (tipurile de conținut asupra cărora securitatea cibernetică și publicitatea doresc cu adevărat să aibă un anumit control) sunt tipurile de conținut care sunt cel mai probabil să se schimbe cu noi domenii și pagini care apar pentru perioade scurte de timp pentru a servi unui anumit scop—înainte de a fi dezafectate pentru a acoperi urmele actorilor răi sau pentru că nu mai servește unui scop.

Stay tuned pentru mai multe despre URL-uri cale completă și clasificarea în timp real. Dacă sunteți interesat de mai multe informații despre clasificarea URL-ul pentru oricare dintre următoarele aplicații, vă rugăm să consultați linkurile de mai jos. Dacă sunteți interesat să discutați cu un reprezentant sau să programați o evaluare, vizitați pagina noastră de Contact.

aplicațiile care beneficiază de control și analiză la calea completă includ:

  • web Filtering & control Parental
  • detecție rău intenționată
  • Subscriber Analytics
  • Brand Safety & direcționare contextuală

doriți să testați unitatea URL-uri proprii cu zvelolive?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/