Minulý mesiac som spracoval všetky slovenské domény a porobil pár grafov. Rozhodol som sa teda, že čosi podobné skúsim aj s českými doménami. Slovenský SK-NIC umožňuje stiahnuť zoznam slovenských domén, no žiaľ český NIC takú možnosť nemá. Na svojej stránke uvádzajú len počet zaregistrovaných domén, pričom aktuálne je zaregistrovaných 1,297 milióna českých domén. Tak som sa dal teda na hľadanie nejakého zoznamu a podarilo sa mi nájsť 4 rôzne zoznamy. Ďalej som si sám vydoloval par stoviek tisíc českých domén z asi 20 rôznych webov. Takto sa mi podarilo vytvoriť zoznam českých domén druhej úrovne o počte 1 311 525 domén. Netuším či by mohol byť na viac ako 90% pokrytý, ale možné to je.
Štatistika slovenských domén (*.sk) · Štatistika zahraničných domén (*.com)
Čiže to je už celkom dosť slušný zoznam, s ktorým som sa už mohol vrhnúť na testovanie. Český NIC síce uvádza 1,297 milióna zaregistrovaných domén, ale to predsa nemusí znamenať, že sú všetky domény aj živé a funkčné. Teda predpokladám, že to tak bude, lebo z môjho zoznamu po otestovaní bolo živých 752 950 domén, ktoré mi pri testovaní vrátili nejaké dáta. Keďže
štatistiku slovenských domén som robil nedávno, tak aby som v prípade českých domén nemal moc odlišné grafy, som použil rovnakú metódu a spravil rovnaké grafy aj pre české domény. Najprv ale začnem s pár grafmi, ktoré som vytvoril z dát na stránke českého NIC, ktoré má v reporte za predchádzajúci rok 2016. Je veľmi veľká škoda, že náš slovenský SK-NIC je na tom tak biedne a nerobí tiež takéto ročne reporty.
Takže začnem prvým grafom, kde je vývoj počtu českých domén v kalendárnych rokoch v období 1999 až 2016. Ako je pekne vidieť na tomto grafe, tak slovenská doména s jej aktuálnym počtom je na úrovni 2006-2007 roku českej domény, čo je dosť smutné.
Nasledujúci graf znázorňuje podiel pohlavia držiteľov domén a taktiež ukazuje rozdelenie držiteľov domén medzi podnikateľmi a fyzickými osobami.
Ďalej je rozdelenie na základe obsahu webových stránok z 1 200 náhodne vybraných českých domén, ale podľa mňa moc tento graf relevantný nebude.
V reporte som ďalej našiel aj aké DNS servery obsluhujú české domény. Graf znázorňuje podiel softvéru podľa unikátneho zoznamu IP adries v NS záznamoch českých domén. Spolu ich obsluhuje 21 578 rôznych DNS serverov. Ak to porovnám so slovenskými doménami, tak tých obsluhuje 13 029 rôznych DNS serverov ak by to niekoho zaujímalo.
Elektronickú poštu pre české domény obsluhuje až 51 123 rôznych mailových serverov. Graf zobrazuje softvérový podiel na mailových serveroch.
Nasledujúcim grafom z reportu je podiel českých domén, ktoré majú dostupné webové servery, DNS servery a mailové servery pomocou IPv6.
Čiže týchto prvých šesť predchádzajúcich grafov som vytvoril z reportu za rok 2016, ktorý zverejnil český NIC a nasledujúce grafy sú z dát mnou otestovaných 1 311 525 českých domén, pričom len 752 950 z nich mi vrátilo nejaké dáta.
Takže začnem a budem pokračovať v takom istom poradí ako v prípade
štatistiky slovenských domén. Nasledujúci graf je podiel domén podľa začiatočného písmena, resp. číslice. Je tam istá podobnosť s grafom slovenských domén. Najviac domén začína na písmeno S, za ním nasleduje písmeno P a do tretice písmeno A. Keď sa ale do grafu pozriete dobre, tak štvrtým písmenom je M z čoho vychádza SPAM :-)
Podiel na základe počtu znakov je na nasledujúcom grafe. Podľa reportu z českého NIC za rok 2016 sú jednoznakové a dvojznakové domény vyčerpané, pričom trojznakové domény sú vyčerpane na 37%, čiže zostáva ešte 29 311 kombinácií. Maximálna dĺžka je taktiež 63 znakov ako aj v prípade slovenskej domény a jediný rozdiel v prípade českej domény je ten, že bola možnosť zaregistrovať si aj jednoznakovú doménu, čo v prípade slovenského SK-NICu nie je možné. Prvé tri priečky obsadili 7 až 9 znakové domény ako aj tomu je aj v prípade slovenskej domény.
Ako som už spomínal pri
štatistike slovenských domén, tak domény s pomlčkou neuznávam, ale mám aj takýto graf. Pri českých doménach je podiel s pomlčkou vyšší ako pri slovenských doménach.
Nasledujúci graf obsahuje prvých 20 IP adries kam má najvyšší počet českých domén nasmerovaný DNS A záznam. Na prvom mieste je 81.2.194.128, ktorá patrí Forpsi a jej reverzný DNS záznam je 128.194.forpsi.net. Na druhom mieste je 81.95.96.29, ktorá patrí Active24 a jej reverzný DNS záznam je default.domeny.cz. Tretia v poradí 77.78.104.3 patrí GRANSY S.R.O. a jej reverzný DNS záznam je yurika.gransy.com. Podľa reportu českého NIC za rok 2016 je v DNS A záznamoch až 65 407 unikátnych IP adries. Môj zoznam bol zložený až z 61 750 unikátnych IP adries, čiže všetky grafy nebudú asi až tak moc skreslené, ako som si na začiatku myslel.
Vyše 80% českých domén vracia HTTP/1.1 200 OK. Čo som si pozeral celý zoznam, tak aj v prípade českých domén niektoré vracali riadne nezmysli ako tomu bolo aj pri slovenských doménach :-)
Čo sa web serverov týka, tak ako je vidieť na grafe, dal som na porovnanie Apache, nginx, openresty (využíva jadro nginx) a IIS od Microsoftu, tak ako aj pri slovenských doménach. Zvyšok sa neoplatil dávať do grafu, lebo boli pod 1%. Bezkonkurenčne vedie Apache a nginx s openresty dosť zaostáva ak to porovnám so slovenskými doménami.
Nasledujúce grafy sú percentuálne podiely verzií web serverov vyššie. Samozrejme tieto grafy nebudú až tak presné, keďže nie každá doména vracia v hlavičkách aj verziu web servera. Ako prvým začnem Apachom, tam jednoznačne boduje verzia Apache 2.2, pričom tomu tak je aj pri slovenských doménach.
Pri nginx ma prvé miesto taktiež verzia 1.10 ako tomu je aj pri slovenských doménach.
Pri openresty patrí prvé miesto verzii 1.11 ako tomu je aj pri slovenských doménach.
Microsoft IIS podľa grafu síce vedie verzia 7.x ale tak ako aj v prípade slovenských domén som rozdelil verziu 8.0 a 8.5, čiže defakto verzia 8.x ma prvenstvo tak ako tomu je aj pri slovenských doménach.
Graf s PHP verziami + ASP.NET bude taktiež skreslený, keďže nie každá doména vracia v hlavičkách aj verziu jazyka. Každopádne je pri českých doménach oveľa vyšší podiel APS.NET ako v prípade slovenských domén. Je tam až 4x vyšší podiel ASP.NET pri českých doménach v porovnaní so slovenskými doménami, pričom PHP verzie majú plus mínus podobné hodnoty.
V Česku prevláda čo sa systémov týka Debian, Ubuntu a Windows v porovnaní so slovenskými doménami. Na slovenských doménach zas prevláda CentOS a FreeBSD, pričom taký Debian ma pri slovenských doménach 3x nižší podiel ako pri českých doménach.
Nasledujúci graf je z hlavičiek Content-Type ak by niekoho aj toto zaujímalo.
Čo sa SSL týka som sklamaný tak isto ako aj pri slovenských doménach, graf je v podstate skoro podobný. Upozorňujem ale, že som netestoval dostupnosť SSL certifikátu, ale to či daný web aj beží výhradne len cez HTTPS protokol, čiže či je HTTP protokol presmerovaný na HTTPS.
21. graf venujem CMS (redakčným systémom), ak ale autor nejakým spôsobom zakamufloval aké CMS mu poháňa web, tak také weby v grafoch nie sú. Identifikoval som skoro 125 tisíc domén, čiže graf by mohol aspoň ako tak trochu o niečom vypovedať. Aj v Českej republike obľubujú autori webov najviac mnou opovrhovaný Wordpress, potom sa niet čomu čudovať, že sa toľko štrikujú tie weby :-)
Pri testovaní som zisťoval taktiež veľkosť stránky, ktorá sa na danej doméne zobrazí. Spočítal som túto veľkosť pri všetkých českých doménach a vyšlo mi číslo 17 232 815 008 bajtov, čo predstavuje 17,2 GB a priemerná veľkosť stránky mi vyšla na 22,9 kB. Tu upozorňujem, že som meral len veľkosť html stránky.
Väčšina informácií v grafoch pochádza len z hlavičiek, pričom české domény posielajú v priemere 9 informácií v hlavičkách, čiže o jednu viac ako tomu je pri slovenských doménach. Síce to nie je moc podstatný graf, ale tak možno to niekoho bude tiež zaujímať.
Musím povedať, že Česi sú rozhodne väčší národniari ako Slováci, čomu nasvedčuje aj nasledujúci graf. V prípade slovenských domén je smerovaných na IP adresy spadajúce pod Slovensko len niečo nad 55%, pričom v prípade českých domén to je niečo nad 85%. Tento fakt by mohol o niečom aj vypovedať, hlavne ak si porovnáme koľko slovenských domén je smerovaných na české IP adresy a naopak koľko českých domén je smerovaných na slovenské IP adresy.
Nasledujúci graf som venoval meta tagu description, ktorý je zoradený podľa počtu slov.
Predposledným grafom je meta tag keywords a taktiež je zoradený podľa počtu slov.
Posledným grafom je opäť taký mišmaš v ktorom je vidieť koľko webov používa Google Analytics na monitorovanie webu, Facebook, Google+, reklamné siete Google AdSense či Etarget a tiež som kontroloval v zdrojákoch jQuery, jQuery UI, Boostrap a Google Fonts. Oplatilo by sa určite toho skontrolovať oveľa viac, ale dosť grafov tu je len z tých základnejších vecí a až tak podrobne ma to veruže nezaujíma :-)
Maximálna dĺžka názvu domény je 63 znakov, ako som už v článku predtým spomínal, tak si neviem predstaviť použitie tak dlhej domény. V Česku sa teda nájde tiež pár jedincov čo si tak dlhú doménu zaregistruje. V zozname českých domén čo som si za pár dní vytvoril som našiel len tieto, ale je možné že ich bude viac:
hryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhryhry.cz
prvni-nejdelsi-domena-v-ceske-republice-ktera-ma-prave-63-znaku.cz
nonstopradio-zastav-se-a-poslouchej-hity-od-80let-po-soucasnost.cz
ahoj-lidi-ja-jsem-honza-stralka-a-toto-je-moje-nova-www-stranka.cz
Podľa mňa je ale škoda peňazí za domény dlhšie ako 20 znakov, aspoň môj osobný názor. V blízkej budúcnosti skúsim spracovať a spraviť podobné grafy zo zoznamu skoro 200 miliónov zahraničných domén čo mám. Moc sa ale na spracovanie neteším, lebo to bude určite na dlhšie.
Čo sa týka údajov v týchto grafoch, tak majú len informačný charakter a čo sa zoznamu českých domén týka, tak o neho nežiadajte, lebo dosť SPAMu chodí aj bez toho a teda zoznam neposkytnem ďalej.
Článok bol zobrazený 15673 krát a obsahuje 1640 slov
Pridané 7. apríla 2017