Articles

Perusalueen URL vs. koko polun URL. Mitä väliä sillä on?

arvioitu lukuaika: 5 minuuttia

Sisällysluettelo

mikä on perusalueen ja koko polun URL-osoitteen ero?

KESKIVERTOSURFFAAJALLE URL—palkki tarjoaa helpon hakupalkin ja ”sumean” tulitikkutyökalun-paljastaen Internetin aarteet ”Enterin” iskulla.

meille IT—rooleissa, ohjelmistokehityksessä tai verkonhallinnassa toimiville-tiedämme, että se muuttuu paljon monimutkaisemmaksi. Livahdamme nopeasti kaninkoloon ja OSI: hen, DNS: ään, TLS: ään, HTTPS: ään, aliverkkotunnuksiin… okei. Keskittyä.

kumppaneillemme verkkoturvallisuudessa, web—suodatuksessa, ad-teknologiassa ja muissa-teemme kriittisen eron kahden Perustyypin URL-osoitteiden välillä: base-verkkotunnukset ja full path-URL-osoitteet.

nopea kertaus URL—osoitteissa

lyhyenä kertauksena URL (Uniform Resource Locator) on URI: n (Uniform Resource Identifier) tietty alatyyppi-yhdessä urnin (Uniform Resource Name) kanssa. Jos olet hämmentynyt-et ole yksin. Se on monimutkaista, ja siksi varmaan olet täällä. Seuraavassa siis nopea jaottelu URL-osoitteen sisällä olevista elementeistä:

koko polun URL: n rakenne
koko polun URL: n rakenne
koko polun URL: n rakenne

URL-osoitteen elementtejä ovat:
  • Protocol (Scheme)
  • Aladomain
  • Domain Name
  • Top Level Domain (TLD)
  • Path/ File (w/extension)
  • parametrit

tarkempi selitys löytyy tämän blogin lopusta löytyvistä muistiinpano-ja viittauslinkeistä.

Perusalueen URL-osoitteet

perusalueen verkko-osoite on sateenvarjo, jonka alla Koko sivusto sijaitsee. Base domain koostuu vain kahdesta URL-elementistä:

  1. verkkotunnus
  2. ylätason verkkotunnus (TLD)

kun käyttäjä syöttää PERUSALUEEN URL-palkkiin (ts. google.com, amazon.com, jne.), DNS ohjaa ne palvelimen IP sijainti kotisivun kunkin sivuston (tietty osoite, kuten /Hakemisto.htm tai / home.html).

luokittelua varten perusalueelle annetaan asianmukainen luokka-arvo, joka edustaa kaikkia verkkosivuston sivuja ja tiedostoja. Perustunnuksen ja sen vastaavan luokan arvon voi sitten sitoa URL-tietokantaan, joka voidaan tallentaa välimuistiin laitteeseen—datakeskukseen, tietokoneeseen tai pilvipalvelun kautta.

reaalimaailmassa kaikki internetliikenne voidaan suodattaa, suojata tai analysoida reaaliaikaisesti viittaamalla välimuistissa olevaan URL-tietokantaan. Mutta minkä tason luokan rakeisuutta tarvitset?

koko polun URL-osoitteet

sen sijaan koko polun URL-osoite tarkoittaa tarkkaa sijaintia (esim.sivu, artikkeli, tiedosto jne.) ja mahdollistaa web-sisällön erittäin tarkan analysoinnin ja luokittelun määritetyssä osoitteessa. Täydellinen polku URL ei sisällä vain verkkotunnuksen ja TLD, se on myös protokolla (alias scheme), aliverkkotunnus (ts. blogi, tuki jne.), polku / kohde, ja mahdollisesti tiedostopääte sekä parametrit.

eli se voi sisältää kaikki seuraavat:

  1. protokolla
  2. Aladomain
  3. verkkotunnus
  4. ylätason Domain (TLD)
  5. Path/File
  6. parametrit (optimaalinen)

vain kaikista näistä elementeistä voidaan tehdä kattava analyysi, jonka avulla voidaan tunnistaa sivun, postin jne.kannalta oleellisin Luokka. Lähes kaksi (2) miljardia sivustoja Internetissä—jokainen pystyy myös miljoonia indeksoituja sivuja—se vaatisi melko mojova tietojen tallennustarve (lievästi sanottuna).

luokittelua varten jokainen vierailtu yksittäinen sivu on analysoitava ja luokiteltava erittäin tarkasti. Kuulostaako monimutkaiselta? Se on.

reaalimaailmassa verkkosisältö muuttuu säännöllisesti. Verkkosivustoja pystytetään, ne vetäytyvät, sisältö muuttuu ja maailma pyörii jatkuvasti – haasteena korkea tarkkuus page / post / file-tasolla. Tämä tarkoittaa, että jokainen sivu on analysoitava ja luokiteltava säännöllisesti (jos ei, koska se on vieraillut).

zvelo saavuttaa lähes reaaliaikaisen, sivutason luokittelun hyödyntämällä koneoppimista ja zveloai-pilven kehittyneitä ominaisuuksia. Autamme kumppaneitamme tunnistamaan sovellukselleen tärkeät sivustot, toimintatavat ja luokat—ja hahmottelemaan työnkulun ja käyttöönoton infrastruktuurin, joka sopii heidän tarpeisiinsa.

Haluatko lisätietoja? Ota yhteyttä.

Let ’s Break It Down

Now that we’ ve looked at base domain and and full path URLs, let ’ s explore a little about what that means.

otetaan esimerkiksi perusdomaani cnn.com. CNN: n verkkosivut voisi luokitella”kansainvälisiksi uutisiksi”ja” Streaming & Downloadable Video ” (joka se on meidän järjestelmämme). Mutta se antaa vain korkean tason luokituksen. CNN: llä on miljoonia sivuja ja artikkeleita kaikesta tenniksestä ja urheilusta politiikkaan ja teknologiaan.

zveloLIVE Categorization Results for CNN.com

yksi luokka (perusalue) verrattuna miljooniin (yksittäiset sivut ja artikkelit)? Tämä on tärkeä ero—varsinkin jos haluat luokitella verkkosisällön erittäin rakeiselle tasolle – olipa kyse sitten verkkosuodatuksesta, joka suojaa lapsia vastenmieliseltä sisällöltä-tai mainosten julkaisijasta, joka haluaa näyttää deodoranttimainoksia vain fitness -, Urheilu-ja muilla asiaankuuluvilla sivuilla.

Behemoth-yhteisöpalveluille, – alustoille ja hakukoneille, kuten Facebookille, Redditille tai Googlelle, tulee entistä vaikeampaa. Saavuttaa korkeampi rakeisuus ja tarkkuus tietyn sisällön kunkin sivun/tiedoston—sinun täytyy tarkastella koko polku.

muut näkökohdat

monille sovelluksille base domain tarjoaa tehokkaan korkean tason ja välimuistissa (nopea) ratkaisun web-suodatuksen (whitelisting / blacklisting) perusominaisuuksiin. Muille, erityisesti kyberturvallisuuteen liittyville, verkkolaitteille (reitittimille, yhdyskäytäville jne.), ja verkkomainonta-kontekstuaalinen merkitys on kriittinen suojan tarjoamiseksi ja käyttäjien käyttäytymisen ja aikomusten ymmärtämiseksi.

monimutkaisuuden lisäksi internet muuttuu jatkuvasti—sekä verkkosivujen sisältö että käyttäjät niihin yhdistävä teknologia. Jopa olemassa oleva sisältö voi muuttua ja päivittyä.

mikä parasta—haitallinen ja vastenmielinen sisältö (ne sisällötyypit, joita kyberturvallisuus ja mainonta todella haluavat hallita) ovat sisältötyyppejä, jotka todennäköisimmin muuttuvat uusien verkkotunnusten ja sivujen ilmestyessä lyhyiksi ajoiksi palvelemaan tiettyä tarkoitusta—ennen kuin ne poistetaan käytöstä peittääkseen huonojen toimijoiden jäljet tai koska niillä ei enää ole tarkoitusta.

pysy kuulolla saadaksesi lisätietoa koko polun URL-osoitteista ja reaaliaikaisesta luokittelusta. Jos olet kiinnostunut lisätietoja URL-luokittelusta seuraavien sovellusten osalta, katso alla olevat linkit. Jos olet kiinnostunut puhumaan edustajan kanssa tai suunnittelemaan arvioinnin, vieraile Yhteydenottosivullamme.

sovelluksia, jotka hyötyvät valvonnasta ja analysoinnista täydellä polulla, ovat:

  • Web Filtering & Lapsilukko
  • Tilaaja-analytiikka
  • Brand Safety&kontekstuaalinen kohdistaminen

haluavat koeajaa some omat URL-osoitteesi zveloliven kanssa?

Check a URL Category

Notes & References:

  • https://tekeye.uk/computing/how-many-websites-are-there
  • http://www.internetlivestats.com/total-number-of-websites/
  • https://www.verisign.com/en_US/domain-names/dnib/index.xhtml
  • https://news.netcraft.com/archives/2018/01/19/january-2018-web-server-survey.html
  • https://danielmiessler.com/study/url-uri/
  • https://damnhandy.com/2009/08/26/url-vs-uri-vs-urn-in-more-concise-terms/