Pred vyše dvoma rokmi som skúsil spraviť podrobnejšiu štatistiku slovenských a českých domén. V tej dobe som mal aj zoznam vyše 200 miliónov zahraničných domén, ale na jeho spracovanie som nemal systémové prostriedky, aby som ho dokázal v nejakom normálnom čase prejsť a život je na druhu stranu moc krátky robiť niečo také. Čiže som v tej dobe prešiel podrobne len .sk a .cz doménu. Niekde mám tie zoznamy ešte odložené ak by som ich niekedy potreboval. Za tie dva roky mi došlo celkom dosť veľa emailov so žiadosťou o český zoznam domén, ale nevyhovel som ani jednému z nich, spamu chodí aj bez toho dosť. Osobne sa mi trebárs vôbec nepáči, že je takto verejne dostupný a denne aktualizovaný zoznam slovenských domén. Povedal som si teda, že skúsim opäť po dvoch rokoch spraviť novú štatistiku a trochu sa ugrafovať. Aj ma trochu zaujíma či bude v niektorých grafoch veľký rozdiel v porovnaní s tými z pred dvoch rokov, alebo ani moc nie. Nezaregistroval som za ten čas nikde, že by sa tomu niekto venoval a spravil niečo podobné, takže budem asi jediný pacient čo zabíja čas takým niečím. Keby tak tvorba grafov nebola náročná na čas, tak by ma aj táto časť celkom bavila. Pri písaní článku ma napadlo to celé zautomatizovať a robiť to na pravidelnej báze, ale neviem k čomu by to bolo.
Štatistika slovenských domén (*.sk) · Štatistika slovenskej domény po rokoch
Pred dvoma rokmi spoločnosť CentralNic, globálny líder v oblasti technológií a spravovania doménových mien oznámila významnú strategickú investíciu na Slovensku. Spoločnosť CentralNic sa stala 100% akcionárom správcu slovenskej internetovej domény najvyššej úrovne .sk, spoločnosti SK-NIC. No po tejto zmene poskytuje web sk-nic.sk aj naďalej denne generovaný zoznam domén a zoznam registrátorov ako som vyššie spomínal. Táto vec nie je bežná pri iných doménach najvyššej úrovne, väčšinou sa k takým zoznamom dostať nedá a ak aj niekto má ako ja trebárs český zoznam domén, tak to sú väčšinou vyskladané zoznamy z rôznych zdrojov. Každopádne aj po zmene vlastníka je tento zoznam naďalej prístupný a mohol som teda analyzovať aktuálny stav slovenských domén. Premýšľal som, že si aktualizujem aj zoznam českých domén, doplním ho o také, ktoré v ňom ešte nie sú a spravím takú štatistiku znova aj pre české domény, ale to prenechám nejakému českému nadšencovi. Nestojí mi to za ten čas, námahu a navyše byť niekoľko krát do mesiaca otravovaný, že či ten tajuplný zoznam českých domén poskytnem sa mi riešiť nechce, keďže nic.cz takýto zoznam nezverejňuje.
Pred zmenou vlastníka spoločnosti SK NIC existoval tzv. proxy držiteľ, kedy bol registrátor zároveň aj držiteľom domény, toto už neplatí a nové pravidlá zakazujú tento typ držiteľa. Na tomto type držiteľa sa popálili aj dve webhostingové spoločnosti, ktoré dostali od štátu celkom mastnú pokutu, ale viac informácii si dohľadajte na internete.
Zoznam domén som si stiahol pred necelými dvoma týždňami, nejaký čas sa spracovával a tiež mi trvalo kým som sa k tomu vôbec dostal a mohol k tomu čosi napísať. Vtedy tento zoznam obsahoval 390 509 domén, pričom som z neho zistil, že tieto domény vlastní spolu 216 579 držiteľov. Táto informácia sa trebárs predtým zistiť nedala, samozrejme toto nemusí byť úplne presný údaj. Jeden fyzický držiteľ môže mať na každú doménu vytvoreného zvlášť držiteľa aj keď sa jedná stále o rovnakú osobu, ale tak aspoň nejaké číslo sa dá z neho vydolovať. Tiež sa mi niečo marí, že sú pol roka, alebo tak nejako v evidencii aj držitelia s nulovým počtom domén kým sa odstránia, takže úplne presné číslo držiteľov vie asi len samotný SK NIC. Na stránke sk-nic.sk existuje aj zoznam registrátorov ako som vyššie spomínal a tam sa nachádza vyše 2 300 evidovaných registrátorov. Zoznam domén, ktorý som spracovával obsahoval ku všetkým doménam a držiteľom len 1 757 registrátorov. Je to síce informácia na dve veci, ale možno niekoho zaujme.
Takže začnem grafom kde sú zoradené domény podľa začiatočného písmena, resp. číslice. Ako pred dvoma rokmi, tak aj tento krát sú na prvom mieste písmena v poradí SPMA. Najviac domén začína na písmeno S, spolu to je 9,98% z celkového počtu domén. Je tam pokles z pred dvoch rokov, kedy to bolo 10,07%. S písmenom P začína 8,26% domén, pričom má taktiež pokles v porovnaní z pred dvoch rokov, kedy to bolo 8,41%. Písmeno M zastáva 7,23% domén z celého zoznamu a tam registrujem stúpanie, keďže pred dvoma rokmi to bolo 7,15%. Písmeno A má 6,69%, ale aké percento to bolo minulý rok neviem. Podľa grafu z pred dvoch rokov mi to príde na asi plus mínus autobus niečo medzi 6,9% až 7%,v každom prípade tam je určite taktiež pokles. Ako je vidieť tak aj naďalej tvoria prvenstvo písmena z ktorých sa dá vyskladať slovo SPAM, že by náhoda? Možno v tom má prsty Soros, kto vie, veď ten poslednú dobu môže snáď za všetko :-D
Čo sa dĺžky domén týka, tak tam v podstate nie je skoro žiadna zmena. Svoje prvenstvo si stále držia 7 až 9 znakové domény. Doména môže obsahovať maximálne 63 znakov a pred dvoma rokmi existovali dve také domény. Dnes existuje už len jedna z nich a to táto doména:
ziskajtepoistenieautaajcestovnepoistenieastavebnesporenieonline.sk
Čo tým kto sleduje nechápem, ale opäť vyjadrím svoj názor a ten je, že to je úplná škoda peňazí za takú doménu. Stále platí čo som spomenul pred dvoma rokmi a to, že všetky 30 a viac znakové domény registrujú asi len kvôli SEO, nič iné ma nenapadá a nevidím v tom zmysel. Mne už 20 znaková doména príde ako nezmysel a nie to 63 znaková :-)
Osobne domény s pomlčkou naďalej neuznávam a divím sa, že ich seriózne aj niekto používa. Každopádne domény s pomlčkami poklesli z 13,93% z pred dvoch rokov na 13,03%.
Spravil som aj graf, ktorý rozdeľuje domény zložené len z písmen, z číslic a písmen, a len z číslic. Samozrejme vedie prvý typ a to zloženie domén len z písmen. To sa dalo aj samozrejme čakať, kombinovanie písmen a číslic mi príde ako vlastniť 63 znakovú doménu, alebo ako domény s pomlčkami, čiže čistý nezmysel. Domény zložené len z číslic samé o sebe nemôžu aj keby chceli mať vysoký podiel skrz kombinácií, takže to matematicky nie je ani možné.
Keďže zoznam držiteľov je neskutočne dlhý, tak som kvôli tomu nerobil ani graf. Nič by nikomu nehovoril ak by som vytiahol len prvých 20 najväčších držiteľov. Osobne používam aj naďalej svoj SK NIC identifikátor, ktorý som si krvopotne zaregistroval, čiže som si prešiel tou známou byrokraciou, ktorá pred 15 rokmi v SK NICu prevládala až do migrácie domén, ku ktorej došlo po zmene vlastníka slovenskej domény. Nezvolil som používanie nových doménových profilov, veď aj načo. Aktuálne sa nachádzam na 280. mieste v počte registrovaných domén, ktorých som držiteľom. Čiže vlastním 0,012% slovenských domén (takže v podstate slovenského internetu, ha ha), ktoré sa dostupné na internete.
Graf najväčších registrátorov som ale spravil, tam má v porovnaní s grafom z pred dvoch rokov rapídnejší nárast len WebSupport.
To iste platí aj pri NS záznamoch, pri prvých troch vedie naďalej WebSupport, keďže ich viac nemá a čo sa týka NS4, tak ten nemá vyplnených 84% domén. Tak tomu bolo aj pred dvoma rokmi, čiže tam v podstate nedošlo k žiadnej zmene. Takže tu sú grafy zoradené za sebou NS1, NS2, NS3 a NS4.
Pozrel som sa aj na stav expirácie všetkých domén a spravil som k tomu dva grafy. Doména sa dá po novom predĺžiť až na 10 rokov dopredu. Doteraz bolo možné predĺžiť doménu len na obdobie jedného roka. Sám mám dve domény zaplatené až do roku 2028, keďže som ich niekedy minulý rok predĺžil na 10 rokov dopredu aby som to vyskúšal. Podľa prvého grafu je vidieť, že každý je stále naučený na predĺženie domény len rok dopredu a na dlhšie obdobie to využíva veľmi málo držiteľov.
Je niekoľko domén ktoré sú zaplatené aj na viac ako jeden rok, ale je ich skutočne o dosť menej, celkovo to sú asi 3% zo všetkých domén.
Pri spracovaní jednotlivých domén som meral aj čas spracovania, presnejšie som meral čas odpovede danej domény kým mi vrátila nejaký obsah a dáta. Mám aj časy ako dlho trvalo spracovať všetky dáta pre jednotlivé domény, ale ten čas asi nemá žiadnu výpovednú hodnotu, takže k tomu som graf nespravil. Najviac domén bolo spracovaných medzi 100 až 199 milisekúnd.
Čo sa týka IP adresy kam smeruje najviac domén, tak tu opäť bez debaty vyhráva WebSupport, skoro všetky IP adresy patria im. Pred dvoma rokmi ich bolo menej a ani by som sa nečudoval ak tu do pár rokov budeme mať na Slovensku len WebSupport a ďalšie nejaké dve / tri väčšie webhostingové spoločnosti a nič viac. Dnes na Slovensku nemá žiadny zmysel zakladať webhosting skrz brutálne silnej konkurencii.
GEO IP lokalizácia sa tiež celkom zmenila za posledné dva roky. Našťastie ale skoro 60% slovenských domén zostáva doma a smeruje na slovenské IP adresy, tam to stúplo v porovnaní z pred dvoch rokov asi o 2%. Určite sú na tom v Česku lepšie, lebo pred dvoma rokmi keď som spracoval české domény, tak okolo 85% českých domén zostalo v Česku a určite by tomu bolo tak aj dnes.
Počet domén so SSL certifikátom celkom dosť stúpol. Síce je tam stále isté sklamanie, hlavne s príchodom Let's Encrypt SSL certifikátom, ktorý je úplne zadarmo, no divím sa, že držitelia domén nevyužívajú aspoň ten. Čakal som, že domén fungujúcich výhradne len na HTTPS bude omnoho viac, ale aj tak sa za posledné dva roky zvýšil celkový počet používajúcich domén SSL certifikát o vyše 20%.
Prednedávnom dostala slovenská doména podporu DNSSEC. Ak by SK NIC neprebrala nová spoločnosť, tak by naša doména bola stále za opicami. Taká česká doména používa DNSSEC už nejaký ten rok, no u nás to je akože nová a vzrušujúca novinka. DNSSEC zabraňuje podvrhnutiu falošných informácií v rámci doménovej infraštruktúry internetu a zabraňuje spojeniu prehliadača s falošnou web stránkou s inou skutočnou IP adresou. Takáto web stránka by mohla vylákať osobné, prihlasovacie či iné citlivé údaje (napr. sa bude tváriť ako web stránka banky). DNSSEC poskytuje dodatočnú úroveň bezpečnosti, vďaka ktorej si webový prehliadač môže overiť, že či je odpoveď na jeho DNS dopyt správna a teda či nebola niekde po ceste útočníkom pozmenená. Používateľ si viditeľnosť tohto overenia môže do všetkých najpoužívanejších webových prehliadačov buď pridať alebo ju už rovno priamo podporujú. DNSSEC je skratka pre „Domain Name System (DNS) Security Extensions“, čo je sada špecifikácií, ktoré umožňujú zabezpečiť informácie poskytované DNS infraštruktúrou v IP sieťach proti podvrhnutiu a úmyselnej manipulácii. DNS klient môže prostredníctvom elektronického podpisu overiť pôvod dát, ich integritu, alebo platnosť neexistencie DNS záznamu.
Na webe sk-nic.sk je v novinkách uvedené, že ku dňu 27.8.2019 už používa DNSSEC viac ako 6 000 slovenských domén. Podľa môjho testovania tomu tak ale nie je. Overoval som pri každej doméne aj túto informáciu a vrátilo mi len 3 770 domén, ktoré prešli mojim testom či majú alebo nemajú aktívne DNSSEC. Je možné, že toľko domén ma u nich vygenerovaných kľúč pre DNSSEC, ale v skutočnosti je DNSSEC funkčné len na 3 770 doménach v čase mojej kontroly. Tiež si môžem zapnúť k nejakej svojej doméne DNSSEC, ale ak následne nastavím iné NS záznamy, ktoré neobsahuje hash pre DNSSEC, tak DNSSEC na takej doméne nie je aktívne predsa. Tým pádom je údaj o 6 000 doménach podľa mňa zavádzajúci a myslím si, že to bude práve tento prípad. Ak sa mýlim, milé rád sa nechám poučiť.
Pri kontrole som zisťoval aj veľkosť stránky, ktorá sa na danej doméne zobrazí. Spočítal som túto veľkosť pri všetkých slovenských doménach a vyšlo mi číslo až 14 700 539 667 bajtov, čo je 14,7 GB. Za posledné dva roky sa tento objem zdvojnásobil, lebo pred dvoma rokmi to bolo 7 GB. Priemerná veľkosť stránky mi vyšla na skoro 37,5 kB, pričom v porovnaní z pred dvoch rokov sa táto priemerná veľkosť zvýšila o 10 kB. Pozrel som si aj aká je najnižšia veľkosť čo bolo 32 bajtov a najvyššia čo som našiel bola až 31 987 741 bajtov, čo je skoro 32 MB. Tu sa mi ale opäť niečo nezdalo ako pred dvoma rokmi. No niekto si dal na doménu PDFko namiesto klasickej html stránky. To už potom vysvetľuje prečo taká veľkosť, jedná sa o doménu formotiva.sk. Ďalšia hneď za ňou mala 9 255 118, čo je 9,2 MB. Každopádne je 356 domén ktoré majú html kód väčší ako 1 MB. Neviem či autori tých webov niečo berú, ale mali by zmeniť dealera, lebo sú to naozaj veľký srandisti...
Pri spracovaní jednotlivých domén som sledoval aj počet slov v title, description, keywords a author. V title obsadili prvé priečky zložené z jedného až ôsmich slov. Čím viac slov, tým sa graf rapídne zmenšuje, preto som dal na koniec grafu 20 a viac slov.
V description vedie s veľkým náskokom 19 slov a potom to začne postupne klesať podľa počtu slov. Vytiahol som len prvých 20 miest, tak ako pri iných grafoch aby ten graf bol pekný a nebol preplnený.
Keywords je na tom podobne, tam má svoje prvenstvo 15 slov, aj keď keywords v dnešnej dobe nemá žiadny zmysel z pohľadu vyhľadávačov, tak ho stále používa dosť webov čo je celkom zaujímavé. Kde sú tí SEO odborníci? :-)
Author som skúsil len tak zo zvedavosti, že čo to spraví. Tam má najviac domén 5 slov a potom to začne veľmi rýchlo klesať a od polovice grafu sa každý počet približuje k nule.
Ukladal som aj metatag robots a tam s veľkým náskokom vedie „index,follow“. Našiel som tam aj celkom pekné nezmysli, ale rôzne texty tam dal asi niekto skôr zo srandy ako by to myslel vážne. Ak to, ale dotyčný myslel vážne, tak to je na zamyslenie sa nad sebou :-)
HTTP/1.1 200 OK si polepšilo za posledné dva roky o vyše 15%, pričom HTTP/1.0 200 OK pokleslo pod 1%.
Ak dobre počítam, tak 23. graf venujem CMSkam (redakčným systémom). Žiaľ ak autor webu zakamufloval nejakým spôsobom cez aké CMSko beží, tak taký web som nedokázal identifikovať. Každopádne som identifikoval skoro 80 tisíc domén, čiže graf bude určite o niečom vypovedať. Vedúcu priečku obsadil ako som čakal opäť mnou nenávidený Wordpress. Wordpress za posledné dva roky narástol o skoro 15%, pričom taká Joomla má pre zmenu o skoro 10% menej. Drupal si krvopotne drží v podstate rovnakú pozíciu, klesol len o pár percent. Kontroloval som aj koľko je diskusných fór založených na phpBB a tam evidujem tiež pokles, momentálne je na 0,23%. Je vidieť, že veľký boom s diskusnými fórami už dávno skončil a skôr začínajú miznúť ako vznikať.
Čo sa web serverov týka, tak som spravil graf len tých asi najviac používaných pri slovenských doménach, tak ako pred dvoma rokmi. Je tam Apache, nginx, openresty (využíva jadro nginx) a posledným je IIS od Microsoftu. Postrehol som, že Apache zostal nezmenený a drží si priečku so svojimi 38%, pričom nginx aj openresty sa zvýšil o 10%, samozrejme treba brať ohľad na to, že sa zvýšil aj počet domén, preto také zvýšenia. Každopádne nginx aj openresty posilnili a keďže openresty využíva jadro nginx, tak je nginx svojim spôsobom najpoužívanejším web serverom na slovenských doménach. Na druhú stranu, ak si zoberieme, že najväčšie percento domén smeruje na WebSupport tak sa niet ani čomu diviť, keďže ich všetky web servery pre webhosting používajú openresty ako proxy server nad Apachom, ktorý tam majú.
Pred dvoma rokmi som spravil aj grafy rozdeľujúce každý web server na rôzne verzie, ale tomu sa tento krát už venovať nebudem. Z pohľadu presnosti to nemá zmysel a ani význam, keďže nie všetky domény vrátia aj verziu web servera. Ak by každá doména túto informáciu obsahovala, tak by to zmysel samozrejme malo. Čo sa týka bezpečnosti, tak je to dobré, že sa tieto informácie nezobrazujú verejne, ale z pohľadu grafov to je nepresná informácia a grafy by boli dosť skreslené ak by som ich generoval len z istej vzorky. Zároveň to je aj časovo veľmi náročné také grafy vytvoriť a popravde sa mi to ani nechce robiť, lebo predpokladám, že budú podobné ako pred dvoma rokmi. Toto sa týka aj jazyka (PHP, ASP.NET), alebo operačného systému aký je na doméne použitý. Také grafy by boli pekné, ale nemá zmysel nad nimi stráviť hodiny času pokiaľ nemám z hlavičiek túto informáciu pre každú doménu. Robiť to len z nejakej malej vzorky je zbytočné. Čo som si pozeral tabuľku, tak jazyk by som vedel zistiť len z 90 tisíc domén, to isté aj aký je použitý operačný systém. Myslím si, že grafy by boli aj tak podobné ako tie z pred dvoch rokov, ktoré si môžete pozrieť tu „
Štatistika slovenských domén (*.sk)“.
Na záver som spravil taký mišmaš ako pred dvoma rokmi. Zisťoval som koľko domén používa Google Analytics, Facebook, Google+, Google Adsense, Etarget, jQuery, jQuery UI, Bootstrap a Google Fonts.
Pred dvoma rokmi som spravil tých grafov o niečo viac, ale ako som vyššie spomínal, tak by to bol zbytočne zabitý čas čo sa rôznych jazykov, verzií a operačných systémov týka. Premýšľal som počas písania článku a generovania grafov, že by som spravil nakoniec aj štatistiku českých domén, ale celé to je náročné na čas a nechce sa mi ho míňať na takéto grafovanie. Podľa mňa sa až tak štatistika určite nezmenila a ak áno, tak asi plus mínus podobne ako pri slovenskej doméne.
Čo sa týka údajov v týchto grafoch, tak majú len informačný charakter.
Článok bol zobrazený 21401 krát a obsahuje 2901 slov
Pridané 14. septembra 2019