Ján Fečík


osobná stránka · blog

Dátum: nedeľa, 24. septembra 2017
Čas: 08:47:52, 1506235672, @324
Meniny má: Ľubor
IP adresa: 54.81.197.127
Prevažne oblačno - Bratislava
12 °C
Slabý dážď
dnes
14 °C / 12 °C
Oblačno
pondelok
16 °C / 12 °C
Slabý dážď
utorok
19 °C / 13 °C
Prevažne oblačno
streda
20 °C / 13 °C

Štatistika zahraničných domén (*.com)

Pred pár mesiacmi som sa dostal k zoznamu, v ktorom je niečo nad 200 miliónov zahraničných domén, za ktorý som zaplatil 9 dolárov ak si dobre spomínam. Predtým ako by som sa pustil do spracovania všetkých domén, som skúsil najprv prebehnúť a spraviť nejaké grafy zo všetkých slovenských domén. Po tom ako som spravil niekoľko grafov sa mi podarilo zozbierať aj celkom slušne veľký zoznam českých domén. V tom čase bolo zaregistrovaných skoro 1.29 milióna domén a v mojom zozname som mal 1.31 milióna domén. Funkčných domén z môjho zoznamu bolo 750 tisíc, čiže som vedel spraviť grafy aj pre české domény s nejakou výpovednou hodnotou.

Štatistika českých domén (*.cz)  ·  Štatistika slovenských domén (*.sk)

Pustil som sa teda do zoznamu s 200 miliónmi domén, tam som musel optimalizovať celý kód skriptu, tak aby trvalo otestovanie domény čo najmenej. Zaplatil som si teda v OVH celkom výkonné VPS a pustil spracovanie zoznamu. Dal som tomu maximálne mesiac, viac sa mi do toho investovať už fakt nechcelo ak nepočítam ten presedený čas. Žiaľ za ten mesiac bolo spracovaných len 65 miliónov domén, čiže som to ukončil. Neviem ani či by mali grafy až takú výpovednú hodnotu, že by stálo za to utratiť viac peňazí ako som utratil. Keď to tak spočítam, tak som kvôli tomu obetoval pár desiatok hodín, asi 80 € ak si dobre spomínam a nemám v podstate nič, to som mohol asi ísť radšej na pivo :-) ale neberiem to až tak tragicky, aspoň som sa naučil pár nových vecí. Ak by som chcel zoznam dokončiť, tak by ma to stálo ešte asi 150 € ak by to netrvalo viac ako je môj odhad a tiež ďalšie desiatky hodín na spracovanie dát a vytvorenie grafov aké som spravil pri slovenských a českých doménach.

Čiže sem dám len tri základne grafy zo zoznamu, prvým grafom je podiel domén podľa začiatočného písmena. Pri slovenských a českých doménach vychádzalo z najpoužívanejších písmen slovo SPAM, no pri zahraničných doménach to vychádza na SCAM, čo je v preklade podvod :-)Štatistika zahraničných domén (*.com)Druhý graf je podľa počtu znakov, ten je trošku odlišný od slovenských a českých domén, ale nie úplne. Nejaká podobnosť tam je, len viac ako 30 znakových domén má vyšší podiel ako tomu bolo pri slovenských a českých doménach.Štatistika zahraničných domén (*.com)Posledným grafom je rozdelenie domén podľa pomlčky. Tam je podobnosť bližšia k slovenským doménam, len v Česku zjavne obľubujú viac domény s pomlčkami ako na Slovensku či v zahraničí. Ako som ale spomínal v predchádzajúcich štatistikách slovenských a českých domén, tak domény s pomlčkami neuznávam. Nikdy som do prehliadača nenapísal žiadnu doménu s pomlčkou a nikdy ani nenapíšem.Štatistika zahraničných domén (*.com)Viac grafov žiaľ nemám, lebo sa mi s tým už nechce zabíjať ani trochu čas a premýšľať ako rýchlejšie zoznam prebehnúť. Popravde sa mi nechcelo písať ani toto všetko, kvôli trom grafom. Predpokladám, že ďalšie grafy by boli podobné grafom slovenským a českým doménam a kvôli potvrdeniu sa mi za to už peniaze vyhadzovať moc nechce.

Článok bol zobrazený 3243 krát a obsahuje 481 slov
Pridané 30. augusta 2017