Ján Fečík


osobná stránka · blog

Dátum: pondelok, 20. novembra 2017
Čas: 03:00:01, 1511143201, @125
Meniny má: Félix
IP adresa: 54.144.57.183
Jasno - Bratislava
5 °C
Polooblačno
dnes
6 °C / 4 °C
Slabý dážď
utorok
9 °C / 6 °C
Slnečno
streda
11 °C / 2 °C
Oblačno
štvrtok
7 °C / 4 °C

Štatistika zahraničných domén (*.com)

Pred pár mesiacmi som sa dostal k zoznamu, v ktorom je niečo nad 200 miliónov zahraničných domén, za ktorý som zaplatil 9 dolárov ak si dobre spomínam. Predtým ako by som sa pustil do spracovania všetkých domén, som skúsil najprv prebehnúť a spraviť nejaké grafy zo všetkých slovenských domén. Po tom ako som spravil niekoľko grafov sa mi podarilo zozbierať aj celkom slušne veľký zoznam českých domén. V tom čase bolo zaregistrovaných skoro 1.29 milióna domén a v mojom zozname som mal 1.31 milióna domén. Funkčných domén z môjho zoznamu bolo 750 tisíc, čiže som vedel spraviť grafy aj pre české domény s nejakou výpovednou hodnotou.

Štatistika českých domén (*.cz)  ·  Štatistika slovenských domén (*.sk)

Pustil som sa teda do zoznamu s 200 miliónmi domén, tam som musel optimalizovať celý kód skriptu, tak aby trvalo otestovanie domény čo najmenej. Zaplatil som si teda v OVH celkom výkonné VPS a pustil spracovanie zoznamu. Dal som tomu maximálne mesiac, viac sa mi do toho investovať už fakt nechcelo ak nepočítam ten presedený čas. Žiaľ za ten mesiac bolo spracovaných len 65 miliónov domén, čiže som to ukončil. Neviem ani či by mali grafy až takú výpovednú hodnotu, že by stálo za to utratiť viac peňazí ako som utratil. Keď to tak spočítam, tak som kvôli tomu obetoval pár desiatok hodín, asi 80 € ak si dobre spomínam a nemám v podstate nič, to som mohol asi ísť radšej na pivo :-) ale neberiem to až tak tragicky, aspoň som sa naučil pár nových vecí. Ak by som chcel zoznam dokončiť, tak by ma to stálo ešte asi 150 € ak by to netrvalo viac ako je môj odhad a tiež ďalšie desiatky hodín na spracovanie dát a vytvorenie grafov aké som spravil pri slovenských a českých doménach.

Čiže sem dám len tri základne grafy zo zoznamu, prvým grafom je podiel domén podľa začiatočného písmena. Pri slovenských a českých doménach vychádzalo z najpoužívanejších písmen slovo SPAM, no pri zahraničných doménach to vychádza na SCAM, čo je v preklade podvod :-)Štatistika zahraničných domén (*.com)Druhý graf je podľa počtu znakov, ten je trošku odlišný od slovenských a českých domén, ale nie úplne. Nejaká podobnosť tam je, len viac ako 30 znakových domén má vyšší podiel ako tomu bolo pri slovenských a českých doménach.Štatistika zahraničných domén (*.com)Posledným grafom je rozdelenie domén podľa pomlčky. Tam je podobnosť bližšia k slovenským doménam, len v Česku zjavne obľubujú viac domény s pomlčkami ako na Slovensku či v zahraničí. Ako som ale spomínal v predchádzajúcich štatistikách slovenských a českých domén, tak domény s pomlčkami neuznávam. Nikdy som do prehliadača nenapísal žiadnu doménu s pomlčkou a nikdy ani nenapíšem.Štatistika zahraničných domén (*.com)Viac grafov žiaľ nemám, lebo sa mi s tým už nechce zabíjať ani trochu čas a premýšľať ako rýchlejšie zoznam prebehnúť. Popravde sa mi nechcelo písať ani toto všetko, kvôli trom grafom. Predpokladám, že ďalšie grafy by boli podobné grafom slovenským a českým doménam a kvôli potvrdeniu sa mi za to už peniaze vyhadzovať moc nechce.

Článok bol zobrazený 14027 krát a obsahuje 481 slov
Pridané 30. augusta 2017