Articles

URL del dominio di base rispetto all’URL del percorso completo. Qual è la differenza?

Tempo di lettura stimato: 5 minuti

Sommario

Qual è la differenza tra un dominio di base e l’URL del percorso completo?

Per il navigatore web medio, la barra degli URL fornisce una barra di ricerca facile e strumento di corrispondenza “fuzzy”—rivelando i tesori di internet al colpo di ‘enter’.

Per quelli di noi in ruoli IT, sviluppo software o amministrazione di rete—sappiamo che diventa molto più complicato. Scivoliamo rapidamente nella tana del coniglio e in sub, DNS, TLS, HTTPS, sottodomini ok ok. Concentrare.

Per i nostri partner in sicurezza della rete, web filtering, ad tech, e altro ancora—c’è una distinzione fondamentale che facciamo tra due tipi di base di URL: domini di base e URL percorso completo.

Un rapido aggiornamento su URL

Come breve aggiornamento, un URL (Uniform Resource Locator) è un sottotipo specifico di URI (Uniform Resource Identifier)—insieme a URN (Uniform Resource Name). Se sei confuso—non sei solo. E ‘complicato, e probabilmente e’ per questo che sei qui. Quindi, ecco una rapida ripartizione di elementi all’interno di un URL:

Struttura di un Percorso Completo, URL
Struttura di un Percorso Completo, URL

Elementi di un URL Includono:
  • Protocol (Scheme)
  • Sottodominio
  • Domain Name
  • Top Level Domain (TLD)
  • Path/ File (w/extension)
  • Parameters

Per una spiegazione più dettagliata, controllare le note e riferimenti link alla fine di questo blog.

URL del dominio di base

Il dominio di base è l’ombrello sotto il quale risiede un intero sito. Un dominio di base è costituito solo da due elementi URL:

  1. Nome di dominio
  2. Dominio di primo livello (TLD)

Quando un utente inserisce un dominio di base nella barra degli URL (es. google.com, amazon.com, ecc.), DNS li indirizza alla posizione IP del server per la home page del rispettivo sito web (un indirizzo specifico come /index.htm o / casa.HTML).

Ai fini della categorizzazione, al dominio di base viene assegnato un valore di categoria appropriato rappresentativo di tutte le pagine e i file contenuti nel sito web. Il dominio di base e il relativo valore di categoria possono quindi essere trasferiti in un database URL, che può essere memorizzato nella cache su un dispositivo, in un data center, su un computer o accessibile tramite il cloud.

Nel mondo reale, implementando un database di categorizzazione URL, tutto il traffico Internet può essere filtrato, protetto o analizzato in tempo reale facendo riferimento al database URL memorizzato nella cache. Ma quale livello di granularità di categoria hai bisogno?

URL del percorso completo

Al contrario, un URL del percorso completo si riferisce a una posizione ESATTA (ad esempio pagina, articolo, file, ecc.) e consente un’analisi e una categorizzazione altamente specifiche dei contenuti web all’indirizzo specificato. Un URL percorso completo non include solo il dominio e TLD, deve includere anche il protocollo (aka scheme), sottodominio (cioè blog, supporto, ecc.), percorso / destinazione e potenzialmente un’estensione di file e parametri.

Che è, è possibile includere tutti i seguenti:

  1. Protocollo
  2. Sottodominio
  3. Nome a Dominio
  4. Top Level Domain (TLD)
  5. Path/File
  6. Parametri (ottimale)

Solo con tutti questi elementi, un’analisi completa essere fatto per identificare la categoria pertinente per la pagina, post, etc. Con quasi due (2) miliardi di siti Web su Internet-ciascuno in grado di includere milioni di pagine indicizzate—ciò richiederebbe un requisito di archiviazione dei dati abbastanza pesante (per dirla alla leggera).

Ai fini della categorizzazione, ogni singola pagina visitata dovrebbe essere analizzata e categorizzata con un alto grado di precisione. Suono abbastanza complicato? Lo e’.

Nel mondo reale, i contenuti web cambiano regolarmente. I siti web vengono messi in piedi, sono in pensione, i cambiamenti di contenuto, e il mondo continua a girare—ponendo una sfida per l’alta precisione a livello di pagina/post/file. Ciò significa che ogni pagina deve essere analizzata e categorizzata regolarmente (se non COME viene visitata).

zvelo realizza una categorizzazione a livello di pagina quasi in tempo reale sfruttando l’apprendimento automatico e le funzionalità avanzate del Cloud zveloAI. Aiutiamo i nostri partner a identificare i siti, i comportamenti e le categorie importanti per la loro applicazione e a delineare un flusso di lavoro e un’infrastruttura di distribuzione adatta alle loro esigenze.

Vuoi maggiori informazioni? Contattare.

Scomponiamolo

Ora che abbiamo esaminato il dominio di base e gli URL del percorso completo, esploriamo un po ‘ su cosa significa.

Prendiamo un dominio di base, ad esempio, cnn.com. Il sito web della CNN potrebbe essere classificato come ‘Notizie internazionali’ e ‘Streaming & Video scaricabile ‘ (che è dai nostri sistemi). Ma questo fornisce solo una classificazione di alto livello. CNN ha milioni di pagine e articoli su tutto che vanno dal Tennis e Sport, alla politica, alla tecnologia.

zveloLIVE Categorizzazione Risultati CNN.com

Una categoria (il dominio di base) rispetto a milioni (le singole pagine e gli articoli)? Questa è una distinzione importante, specialmente se stai cercando di classificare i contenuti Web a un livello altamente granulare, sia per il filtraggio Web per proteggere i bambini da contenuti discutibili, sia per un editore di annunci che cerca di visualizzare annunci pubblicitari per deodorante solo su fitness, sport e altre pagine pertinenti.

Diventa ancora più difficile per il colosso social network, piattaforme, e motori di ricerca come Facebook, reddit, o Google. Per ottenere un livello più elevato di granularità e precisione per il contenuto specifico su ogni pagina/file, è necessario esaminare il percorso completo.

Altre considerazioni

Per molte applicazioni, base domain fornisce una soluzione efficace di alto livello e memorizzabile nella cache (ad alta velocità) per funzionalità di filtraggio web di base (whitelist / blacklist). Per altri, in particolare quelli in sicurezza informatica, dispositivi di rete(router, gateway, ecc.) e pubblicità online-la rilevanza contestuale è fondamentale per fornire protezione e comprendere il comportamento e l’intento dell’utente.

Aggiungendo al livello di complessità, Internet è in continua evoluzione—sia il contenuto delle pagine web che le tecnologie che collegano gli utenti a loro. Anche i contenuti esistenti sono soggetti a modifiche e aggiornamenti.

Inoltre, i contenuti dannosi e discutibili (i tipi di contenuti su cui la sicurezza informatica e la pubblicità vogliono davvero avere un certo controllo) sono i tipi di contenuti che hanno maggiori probabilità di cambiare con nuovi domini e pagine che spuntano per brevi periodi di tempo per servire uno scopo specifico—prima di essere dismessi per coprire le tracce di cattivi attori o perché non servono più uno scopo.

Restate sintonizzati per ulteriori informazioni sugli URL del percorso completo e sulla categorizzazione in tempo reale. Se siete interessati a ulteriori informazioni sulla categorizzazione URL per le seguenti applicazioni, si prega di consultare i link qui sotto. Se sei interessato a parlare con un rappresentante o a pianificare una valutazione, visita la nostra pagina di contatto.

le Applicazioni che beneficiano di controllo e di analisi all’intero percorso sono:

  • Filtro Web & controllo Genitori
  • Dannoso di Rilevamento
  • Sottoscrittore Analytics
  • Brand di Sicurezza & Targeting Contestuale

Vuoi test drive di alcuni Url che con zveloLIVE?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/