Articles

URL do domínio de Base vs. URL da localização completa. Qual é a diferença?

tempo de leitura estimado: 5 minutos

Índice

Qual é a diferença entre um domínio de base e um URL completo da localização?

para o surfista web médio, a barra de URL fornece uma barra de pesquisa fácil e ferramenta de correspondência “fuzzy”—revelando os tesouros da internet no traço de ‘enter’.

para aqueles de nós em funções de TI, desenvolvimento de software, ou administração de rede—sabemos que fica muito mais complicado. Deslizamos rapidamente pela toca do coelho para OSI, DNS,TLS, HTTPS, subdomínios… Focar.

para nossos parceiros em segurança de rede, filtragem de web, AD tech, e muito mais—há uma distinção crítica que fazemos entre dois tipos básicos de URLs: domínios base e URLs caminho completo.

uma atualização rápida em URLs

como uma atualização breve, um URL (Uniform Resource Locator) é um subtipo específico de URI (Uniform Resource Identifier)—junto com a urna (Uniform Resource Name). Se estás confuso, não estás sozinho. É complicado, e deve ser por isso que estás aqui. Então, aqui está uma rápida decomposição dos elementos dentro de um URL:

Estrutura de um Caminho Completo da URL
Estrutura de um Caminho Completo da URL

Elementos de uma URL Incluem:
  • Protocol (Scheme)
  • Subdomain
  • Domain Name
  • domínio de topo (TLD)
  • Path/File (w/ extension)
  • arâmetros

para uma explicação mais detalhada, verifique as ligações de notas e referências no final deste blog.

URLs de domínio Base

o domínio de base é o guarda-chuva sob o qual um site inteiro reside. Um domínio de base consiste em apenas dois dos elementos URL:

  1. Domain Name
  2. domínio de topo (TLD)

Quando um utilizador entra num domínio de base na barra de URL (i.e. google.com, amazon.com, etc.), DNS direciona-os para a localização IP do servidor para a página inicial do respectivo site (um endereço específico como /index.htm ou / home.galeria).

para fins de categorização,ao domínio de base é atribuído um valor de categoria apropriado que é representativo de todas as páginas e arquivos contidos no site. O domínio de base e seu respectivo valor de categoria podem então ser comprometidos com um banco de dados URL, que pode ser cache em um dispositivo—em um centro de dados, em um computador, ou acessível através da nuvem.

no mundo real, ao implementar um banco de dados de categorização de URL, todo o tráfego da internet pode ser filtrado, protegido ou analisado em tempo real, por referência ao banco de dados URL Cache. Mas de que nível de granularidade precisa?

URLs de localização completa

em contraste, um URL de localização completa refere-se a uma localização exata (ou seja, página, artigo, arquivo, etc.) e permite uma análise altamente específica e categorização de conteúdo web no endereço especificado. Um URL de caminho completo não só inclui o domínio e TLD, ele também deve incluir o protocolo (esquema aka), subdomain (i.e. blog, suporte, etc.), caminho/destino, e potencialmente uma extensão de arquivo, bem como parâmetros.

isto é, pode incluir todos os seguintes:

  1. Protocolo
  2. Subdomínio
  3. Nome de Domínio
  4. Domínio de Nível Superior (TLD)
  5. Caminho/Arquivo
  6. Parâmetros (ótimo)

Só com todos esses elementos pode fazer uma análise abrangente de ser feita para identificar a categoria mais relevante para a página, post, etc. Com quase dois (2) bilhões de sites na internet-cada um capaz de incluir milhões de páginas indexadas—isso exigiria um requisito de armazenamento de dados bastante elevado (para colocá-lo levemente).

para fins de categorização, cada página individual visitada precisaria ser analisada e categorizada com um alto grau de precisão. Parece-te bastante complicado? É.

no mundo real, o conteúdo da web muda regularmente. Sites são colocados, são aposentados, mudanças de Conteúdo, e o mundo continua girando—o que representa um desafio para a alta precisão no nível de página/post/arquivo. Isso significa que cada página deve ser analisada e categorizada regularmente (se não como é visitada).

zvelo realiza quase em tempo real, categorização de nível de página, alavancando a aprendizagem da máquina e as capacidades avançadas da nuvem de zveloAI. Ajudamos os nossos parceiros a identificar os locais, comportamentos e categorias importantes para a sua aplicação—e ajudamos a delinear um fluxo de trabalho e infra-estrutura de implantação que se adapte às suas necessidades.Quer mais informações? Contacte-nos.

vamos dividi-lo em

Agora que olhamos para o domínio de base e URLs de caminho completo, vamos explorar um pouco sobre o que isso significa.

tomemos um domínio de base, por exemplo, cnn.com o site da CNN pode ser categorizado como’ notícias internacionais ‘e’ Streaming & vídeo descarregável ‘ (que é por nossos sistemas). Mas isso só proporciona uma classificação de alto nível. A CNN tem milhões de páginas e artigos sobre tudo, desde tênis e Esportes, À Política, à tecnologia.

zveloLIVE Categorização Resultados para CNN.com

Uma categoria (o domínio de base), em comparação com milhões de pessoas (todas as páginas e artigos)? Essa é uma distinção importante-especialmente se você está olhando para classificar o conteúdo da web em um nível altamente granular-se para filtragem da web para proteger as crianças de conteúdo censurável-ou um editor de publicidade que procura exibir anúncios para desodorizante apenas em fitness, esportes, e outras páginas relevantes.torna-se ainda mais difícil para as redes sociais, plataformas e motores de busca como facebook, reddit ou google. Para alcançar um nível mais elevado de granularidade e precisão para o conteúdo específico em cada página/arquivo—você precisa olhar para o caminho completo.

outras considerações

para muitas aplicações, o domínio base fornece uma solução eficaz de alto nível e cacheável (de alta velocidade) para filtragem web básica (whitelisting/blacklisting) capacidades. Para outros, em particular os da cibersegurança, dispositivos de rede (routers, gateways, etc.), e Publicidade online-relevância contextual é fundamental para proporcionar proteção e compreensão do comportamento e intenção do Usuário.adicionando ao nível de complexidade, a internet está em constante mudança—tanto o conteúdo nas páginas web como as tecnologias que ligam os usuários a elas. Mesmo o conteúdo existente está sujeito a alterações e atualizações.

o Que há de mais—mal-intencionados e conteúdo questionável (os tipos de conteúdo que a segurança cibernética e a publicidade realmente quero ter algum controle sobre) são os tipos de conteúdo que são mais susceptíveis de mudança, com novos domínios e páginas aparecendo por curtos períodos de tempo para servir a um propósito específico—antes de ser encerrado para cobrir as faixas de maus atores ou porque ele não serve a um propósito.

fique sintonizado para mais em URLs de caminho completo e categorização em tempo real. Se você estiver interessado em mais informações sobre categorização de URL para quaisquer das seguintes aplicações, por favor veja os links abaixo. Se você está interessado em falar com o representante ou agendar uma avaliação, Visite nossa página de contato.

Aplicativos que se beneficiam de controle e análise, o caminho completo inclui:

  • Filtragem de sites & Controles dos pais
  • Maliciosos de Detecção
  • Assinante do google Analytics
  • Marca de Segurança & Segmentação Contextual

Quer test drive algumas URLs do seu próprio, com zveloLIVE?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/