Articles

URL du domaine de base par rapport à l’URL du chemin complet. Quelle est la différence?

Temps de lecture estimé : 5 minutes

Table des matières

Quelle est la différence entre un domaine de base et une URL de chemin complet ?

Pour l’internaute moyen, la barre d’URL fournit une barre de recherche facile et un outil de correspondance « floue » – révélant les trésors d’Internet au coup de « entrée ».

Pour ceux d’entre nous qui occupent des fonctions informatiques, de développement de logiciels ou d’administration de réseau, nous savons que cela devient beaucoup plus compliqué. Nous glissons rapidement dans le trou du lapin et dans OSI, DNS, TLS, HTTPS, sous-domaines ok ok. Concentrer.

Pour nos partenaires dans la sécurité réseau, le filtrage Web, la technologie publicitaire, etc., il existe une distinction critique que nous faisons entre deux types d’URL de base : les domaines de base et les URL de chemin complet.

Un rappel rapide sur les URL

En tant que rappel bref, une URL (Uniform Resource Locator) est un sous—type spécifique d’URI (Uniform Resource Identifier) – avec URN (Uniform Resource Name). Si vous êtes confus, vous n’êtes pas seul. C’est compliqué, et c’est probablement pour ça que tu es là. Voici donc une ventilation rapide des éléments d’une URL:

Structure d'une URL de Chemin complet
Structure d’une URL de chemin complet
Structure d’une URL de chemin complet
Les éléments d’une URL incluent:
  • Protocole (Schéma)
  • Sous-domaine
  • Nom de domaine
  • Domaine de premier niveau (TLD)
  • Chemin / fichier (avec extension)
  • Paramètres

Pour une explication plus détaillée, consultez les liens notes et références à la fin de ce blog.

URL du domaine de base

Le domaine de base est le parapluie sous lequel réside un site entier. Un domaine de base ne comprend que deux des éléments d’URL :

  1. Nom de domaine
  2. Domaine de premier niveau (TLD)

Lorsqu’un utilisateur entre un domaine de base dans la barre d’URL (c’est-à-dire google.com , amazon.com , etc.), DNS les dirige vers l’emplacement IP du serveur pour la page d’accueil du site Web respectif (une adresse spécifique telle que /index.htm ou / accueil.HTML).

À des fins de catégorisation, le domaine de base se voit attribuer une valeur de catégorie appropriée représentative de toutes les pages et fichiers contenus dans le site Web. Le domaine de base et sa valeur de catégorie respective peuvent ensuite être validés dans une base de données d’URL, qui peut être mise en cache sur un appareil — dans un centre de données, sur un ordinateur ou accessible via le cloud.

Dans le monde réel, en implémentant une base de données de catégorisation d’URL, tout le trafic Internet peut être filtré, protégé ou analysé en temps réel en référençant la base de données d’URL mise en cache. Mais de quel niveau de granularité de catégorie avez-vous besoin?

URL de chemin complet

En revanche, une URL de chemin complet fait référence à un emplacement EXACT (page, article, fichier, etc.) et permet une analyse et une catégorisation très spécifiques du contenu Web à l’adresse spécifiée. Une URL de chemin complet inclut non seulement le domaine et le TLD, mais elle doit également inclure le protocole (aka scheme), le sous-domaine (i.e. blog, support, etc.), chemin/destination, et potentiellement une extension de fichier ainsi que des paramètres.

C’est-à-dire qu’il peut inclure tous les éléments suivants :

  1. Protocole
  2. Sous-domaine
  3. Nom de domaine
  4. Domaine de premier niveau (TLD)
  5. Chemin / Fichier
  6. Paramètres (optimaux)

Ce n’est qu’avec tous ces éléments qu’une analyse complète peut être effectuée pour identifier la catégorie la plus pertinente pour la page, la publication, etc. Avec près de deux (2) milliards de sites Web sur Internet — chacun pouvant inclure des millions de pages indexées — cela nécessiterait un stockage de données assez important (pour le dire légèrement).

À des fins de catégorisation, chaque page visitée devra être analysée et catégorisée avec un degré élevé de précision. Cela vous semble assez compliqué? Ça l’est.

Dans le monde réel, le contenu web change régulièrement. Les sites Web sont mis en place, sont retirés, le contenu change et le monde continue de tourner — ce qui pose un défi pour une grande précision au niveau de la page / publication / fichier. Cela signifie que chaque page doit être analysée et catégorisée régulièrement (sinon AU fur et à mesure qu’elle est visitée).

zvelo réalise une catégorisation en temps quasi réel au niveau des pages en tirant parti de l’apprentissage automatique et des capacités avancées du Cloud zveloAI. Nous aidons nos partenaires à identifier les sites, les comportements et les catégories importants pour leur application et à définir un flux de travail et une infrastructure de déploiement adaptés à leurs besoins.

Vous voulez plus d’informations? Contacter.

Décomposons-le

Maintenant que nous avons examiné le domaine de base et les URL de chemin complet, explorons un peu ce que cela signifie.

Prenons un domaine de base, par exemple, cnn.com Le site Web de .CNN pourrait être classé comme « Nouvelles internationales » et « Streaming &Vidéo téléchargeable » ’ce qu’il est par nos systèmes). Mais cela ne fournit qu’une classification de haut niveau. CNN a des millions de pages et d’articles sur tout, du Tennis et du sport, à la Politique, à la Technologie.

Résultats de catégorisation zveloLIVE pour CNN.com

Une catégorie (le domaine de base) par rapport à des millions (les pages et articles individuels) ? C’est une distinction importante — surtout si vous cherchez à classer le contenu Web à un niveau très granulaire — que ce soit pour le filtrage Web pour protéger les enfants contre le contenu répréhensible — ou un éditeur de publicité cherchant à afficher des publicités pour le déodorant uniquement sur des pages de fitness, de sport et autres pages pertinentes.

Cela devient encore plus difficile pour les réseaux sociaux, les plateformes et les moteurs de recherche mastodontes comme facebook, reddit ou google. Pour obtenir un niveau de granularité et de précision plus élevé pour le contenu spécifique de chaque page / fichier, vous devez consulter le chemin d’accès complet.

Autres considérations

Pour de nombreuses applications, le domaine de base fournit une solution efficace de haut niveau et cachable (haute vitesse) pour les capacités de filtrage Web de base (liste blanche /liste noire). Pour d’autres, notamment ceux de la cybersécurité, des périphériques réseau (routeurs, passerelles, etc.), et la publicité en ligne — la pertinence contextuelle est essentielle pour assurer la protection et comprendre le comportement et l’intention des utilisateurs.

Ajoutant au niveau de complexité, Internet est en constante évolution — à la fois le contenu des pages Web et les technologies qui y connectent les utilisateurs. Même le contenu existant est sujet à changement et à mises à jour.

De plus, les contenus malveillants et répréhensibles (les types de contenus sur lesquels la cybersécurité et la publicité veulent vraiment avoir un certain contrôle) sont les types de contenus les plus susceptibles de changer avec l’apparition de nouveaux domaines et de nouvelles pages pendant de courtes périodes pour servir un objectif spécifique — avant d’être désactivés pour couvrir les traces de mauvais acteurs ou parce qu’ils ne servent plus un objectif.

Restez à l’écoute pour en savoir plus sur les URL de chemin complet et la catégorisation en temps réel. Si vous souhaitez plus d’informations sur la catégorisation des URL pour les applications suivantes, veuillez consulter les liens ci-dessous. Si vous souhaitez parler à un représentant ou planifier une évaluation, visitez notre page de contact.

Les applications qui bénéficient du contrôle et de l’analyse sur le chemin complet incluent :

  • Filtrage Web &Contrôle parental
  • Détection de malveillance
  • Analyse des abonnés
  • Sécurité de la marque&Ciblage contextuel

Vous souhaitez tester certaines URL à vous avec zveloLIVE ?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/