Tölfræði íslenskra léna

Undanfarnar vikur hef ég unnið í því verkefni að safna í lista yfir .is lén. Þar sem ISNIC, af skiljanlegum ástæðum, vill ekki gefa út lista yfir .is lén neyddist ég til þess að standa sjálfur að söfnun hans. Hingað til hef ég eingöngu náð 70% af skráðum lénum en hins vegar er hægt að nota það úrtak til að áætla til um seinustu 30 prósentin.

Áhugaverðar niðurstöður eru þó komnar fram.

Á nafnaþjónamarkaðnum er 1984 ehf. með yfirburðarstöðu (a.m.k. 3405 lén) og má þar líklega þakka FreeDNS þjónustunni þeirra. Síðan kom á óvart hversu margir nýta nafnaþjónaþjónustu ISNIC en þeir bjóða upp á biðsvæði (a.m.k. 1790 lén) og áframsendingarþjónustu (a.m.k. 941 lén)

Lénaeigendur virðast velja ódýrari póstþjónusturnar en í fyrsta sæti er Google (a.m.k. 2202 lén), líklega vegna Google Apps þjónustunnar. Síminn hf. virðist vera með sér póstþjóna fyrir þjónustulínur svo erfiðara er að áætla samanlagðan fjölda léna sem þeir hýsa póst fyrir. Hann er líklegur í annað sæti en vinna þarf frekar úr tölunum áður en það er vitað fyrir víst.

Athygli er vakin á því að þrátt fyrir því að nafnaþjónar og póstþjónar séu vanalega boðnir í pökkum, þá eru þeir ekki allir notaðir. Þar sem ISNIC leyfir eingöngu 4 opinberlega skráða nafnaþjóna er skiljanlegt að fólk noti þá ekki alla, sérstaklega ef fólk vill dreifa hýsingu þeirra milli hýsingaraðila. Engin slík föst takmörk eru á fjölda póstþjóna (sem fólk hefur áhyggjur af) en samt er stundum stór munur á fjölda léna sem skráð eru á póstþjóna hvers hýsingaraðila. Aðalpóstþjónninn fyrir Google Apps er með a.m.k. 2202 lén á meðan sá næsti er með a.m.k. 2060 lén.

Ruslpóstsvarnir

Ég vildi minnast á það að nokkuð margir skrá netföng sín á brenglaðan hátt til að forðast ruslpóst, meðal annars stofnanir ríkisins. Af því tilefni vildi ég láta ykkur vita að tækni netfangasafnaranna er komin nógu langt til að nema þess konar feluleiki. Þessir feluleikir gera fólki enn erfiðara að hafa samband við ykkur. Síðan er ég nokkuð viss um að spammararnir eru þegar komnir með netföngin ykkar því það tekur bara einn stað til að netföngin komist á listann þeirra. Það er ekki eins og þeir þurfi að finna það aftur í hvert skipti sem þeir vilja hafa samband við ykkur.

Svo ég taki sjálfan mig sem dæmi set ég netfangið mitt óhikað og óbrenglað á netið og ég sé varla ruslpóst í pósthólfinu. Einn og einn sleppur í gegn en það tekur bara einn delete takka til að redda því.

Fáið ykkur bara góða ruslpóstsvörn.

Niðurhalsskattur STEF

Í Fréttablaðinu 8. október er sagt frá því að Eiríkur Tómasson hafi kynnt hugmynd á fundi hjá STEF um að setja gjöld á nettengingar á Íslandi gegn því að í boði verði svæði þar sem fólk getur náð sér í tónlistina löglega. Hugmyndin um gjöld á nettengingar er alls ekki ný en álíka hugmyndir hafa verið bornar upp af rétthafasamtökum erlendis. Þetta er þó í fyrsta sinn sem ég hef heyrt af þeirri útfærslu að samtökin bjóði upp á niðurhal í staðinn.

En hvað er að þessari hugmynd? Er ekki allt í lagi að borga smá gjald og í staðinn má niðurhala eins mikið af tónlist og maður vill? Misskilningurinn kemur fram í seinni hluta spurningarinnar. Meðal gallanna er sú staðreynd að ekkert mun breytast hvað varðar það niðurhal sem netverjar hafa stundað. Ef við ímyndum okkur það sem gerist ef þetta verður að veruleika, þá er það eina sem breytist er að netreikningurinn hækkar og í staðinn fáum við aðgang að svæði til að niðurhala tónlist. Það verður áfram ólöglegt að niðurhala tónlist frá öðrum stöðum. Í grunninn séð er verið að neyða okkur til að greiða fyrir þjónustu óháð því hvort við höfum nokkurn áhuga á að nota hana eða ekki.

Og hvað þýðir þetta? Neydd viðskipti. Allir nettengdir Íslendingar yrðu neyddir til að eiga viðskipti við STEF, hvort sem þeim líkar betur eða verr. Hvernig litist þér á ef þú yrðir einnig neyddur til að greiða gjald til rithöfunda í hverjum mánuði ofan á nettenginguna þína? Ekki fá rithöfundar neitt í hvert sinn sem þú flettir upp á einhverju á netinu. Ef þetta verður að lögum er ríkið að blanda sér í mál sem það ætti ekki að snerta á.

STEF eru auðvitað ekki einu rétthafasamtökin. Um leið og við höfum samþykkt hugmyndina um að gjald sé sett á nettengingar vegna einna rétthafasamtaka, af hverju ættum við að hafna beiðni annarra samtaka ef þau óska eftir því að taka líka þátt? Gjaldið sem átti að vera lítið og nett er allt í einu orðið byrði á netnotendur. 500 króna gjaldið gæti orðið að 2000 króna gjaldi og gæti orðið að helmingnum af því sem netaðgangurinn kostar.

Samkomulagið yrði auðvitað nokkuð auðvelt fyrir STEF. Þeir bjóða nú þegar upp á sömu þjónustu gegn gjaldi og því væri lítið mál fyrir samtökin að efna sinn hluta af því. Núna eru þau að reyna að koma því í gegn að allir netnotendur á Íslandi séu neyddir til að greiða fyrir þjónustuna og auðvitað hlustar sokkabrúða þeirra, Katrín Jakobsdóttir, á rétthafasamtökin.

STEF er einnig á rangri leið, hugmyndafræðilega séð. Ef við ímyndum okkur fræðilegt hlutverk þeirra, þá á það að vera að vernda rétt höfundanna sem það samanstendur af. En núna virðast samtökin ætla að fara út í það að bjóða upp á niðurhal gegn greiðslu. Hver verndar rétt höfunda gagnvart STEF í þessum málum? Hvað um rétt höfunda sem vilja ekkert með þetta samkomulag að gera? Það á ekki að vera hlutverk samtakanna að fara út í slík viðskiptamódel. Hugmyndafræðin styður ekki að samtökin sjálf gerist dreifingaraðilar á verkum meðlima þess.

Lykilorðareglur Einkabankans

Í netbanka Landsbankans, Einkabankanum, má finna reglulegar áminningar um skipta ætti um lykilorð. Í tilefni af því að ég fékk mér forrit sem er sérstaklega hannað til að geyma lykilorð ákvað ég að breyta lykilorðinu mínu í Einkabankanum. Á lykilorðabreytingasíðunni rakst ég hins vegar á nokkrar reglur um það hvernig lykilorðin eiga að vera samsett.

  1. Lykilorð verður að vera minnst 8 stafir á lengd, hámarkslengd er 16 stafir.
  2. Lykilorð má ekki innihalda aðra stafi en bókstafi og tölustafi.
  3. Það má ekki innihalda séríslenska stafi (á, ð, é, í, ó, ú, ý, þ, æ, ö).
  4. Það má ekki innihalda eingöngu bókstafi.
  5. Það má ekki byrja á tölustaf.
  6. Sami stafur má ekki koma fyrir oftar en tvisvar í röð.

Hver sem hefur kynnt sér tölfræði ætti að geta séð að hér er um að ræða fáránlegar reglur og virðast sumar þeirra ekki þjóna neinum tilgangi. Aðaltilgangurinn með svona vörnum er aðallega sá að minnka líkur á að hægt sé að giska á lykilorðin með hreinni ágiskun og síðan koma í veg fyrir skipulagðar tilraunir til að komast að lykilorðunum. Í þetta sinn munum við hunsa auðkennislykilinn þar sem rökin koma honum ekkert við.

Eitt af því sem venjulega er hunsað er sá möguleiki að einhver óheiðarlegur komist inn í netþjóna bankans og nái eintaki af lykilorðum viðskiptavinanna. Þar sem lykilorðin eru geymd í dulkóðuðu formi þurfa ræningjarnir að annaðhvort afkóða lykilorðin eða nota „brute force“ aðferðir sem ganga út á að láta forrit athuga með hverja mögulega samsetningu tákna þar til þeir hitta á lykilorðið. Við gerum ráð fyrir að þeir þurfi að framkvæma þetta þannig að þeir þurfa að ná í dulkóðuðu skrárnar og brjóta lykilorðin hjá sér. Ef þeir reyna að millifæra peninga beint af netþjónum bankans mun komast upp um þá of fljótt og hagnaður þeirra verður miklu minni en ella.

Nú eru ræningjarnir með lykilorðaskrána og neyðast til að brjóta lykilorðin með ágiskunaraðferðinni. Hversu margar ágiskanir tæki það forritið sem þeir keyra áður en það hittir á hvert lykilorð? Skv. prófunum mínum í Einkabankanum skipta háir og lágir stafir ekki máli svo við munum gera ráð fyrir því fyrirkomulagi. Hver ágiskun prófar eina samsetningu af leyfilegum táknum og sér síðan hvort hún gengur upp. Hvernig það er staðfest fer eftir aðstæðum en oftast nær er það hægt án þess að reyna að tengja sig inn á Einkabankann. Því fleiri mögulegar samsetningar af táknum, því lengur tekur það ræningjana að brjóta lykilorðið.

Gerum ráð fyrir að efstu tvær reglurnar sé þær einu sem gilda og að allir viðskiptavinirnir noti 16 stafa lykilorð og í boði eru allir bókstafir í íslenska og enska stafrófinu auk tölustafa. Þetta væru þá 46^16 (46 í 16. veldi) mögulegar samsetningar af stöfum. Ræningjarnir þyrftu samt sem áður að prófa einnig allar samsetningar fyrir 8, 9, 10, 11, 12, 13, 14 og 15 stafi líka en í dæmunum er ekki tekið á því. Til að reikna það út þyrfti að margfalda 46^16 með 46^15 og svo framvegis niður í 8. veldi. Upp á besta samanburðinn miða ég við 16 stafa lykilorð.

Segjum að viðskiptavinir bankans fái síðan fyrirmæli um að þeir verði að breyta lykilorðunum sínum því þriðju reglunni var bætt inn og nú geta þeir ekki notað séríslenska stafi (á, ð, é, í, ó, ú, ý, þ, æ, ö) sbr. hér að ofan. Bara með þessari reglu fækkaði samsetningunum niður í 36^16 sem er um 1,98% af 46^16. Ef lengdir upp á 8 til 15 stafi séu einnig teknar með í útreikningana er óhætt að álykta að hlutfallið minnkar enn þá meira.

Til að draga greinina ekki óþarflega á langinn með sífelldum útreikningum læt ég mér nægja að nefna að hver regla takmarkar fjölda samsetninga enn frekar. Eftir að hafa reynt að hugsa út í ástæðurnar fyrir hverri reglu datt mér ekki í hug nein réttlætanleg ástæða fyrir þessum takmörkunum. Tækninni hefur fleygt fram og er engin ástæða til þess að undanskilja séríslenska stafi og (nær) engin ástæða til þess að takmarka lykilorðin heldur við latneska bókstafi og tölustafi. Auk þess tel ég óhætt fyrir bankann að heimila lengri lykilorð en 16 stafi. Það mætti halda að bankinn sé enn á þeim tíma þegar Þjóðskráin hafði 32ja stafa hámark á nöfnum fólks í tölvukerfinu sínu (sem nú hefur verið hækkað í 256 stafi).

Kostir reglanna
Þó eru 1 þáttur í stefnunni sem ég get verið sammála en hann er lágmarkslengd lykilorða (8 stafir). Það tekur í mesta lagi nokkrar sekúndur á venjulegri heimilistölvu að brjóta lykilorð sem eru með færri en 8 stafi. Hinir takmarka mögulegar samsetningar að einhverju leiti. Önnur regla sem ég er hálfsammála er 4. reglan; Þó hún sé takmarkandi þá hefur hún þau áhrif að viðskiptavinurinn getur ekki notað þekkt orð eða skammstafanir en ég er þá ósammála henni vegna þess að reynslan hefur sýnt að notendur almennt setja einfaldlega tölustafi fyrir aftan venjuleg orð og forrit ræningjanna getur sett þau lykilorð í forgang.

Ókostir
Farið hefur verið ofan í útreikningana vegna 3. reglunnar sem virðist ekki vera byggð á neinni tæknilegri ástæðu. Þar sem lykilorðin eru geymd dulkóðuð ætti það ekki að hafa nein áhrif hvað varðar stafasett inn í lykilorðagrunninum. En tilgátan mín er sú, að fyrst háir og lágir stafir skipta ekki máli, að forritið sem tekur á móti lykilorðum breytir öllu lykilorðinu í lágstafi (eða hástafi). Íslensku stafirnir séu síðan bannaðir því forrit bankans notar innbyggða skipun til að breyta lykilorðastrengnum í lágstafi (eða hástafi). Sú skipun styður ekki íslenska stafi og forritararnir hafi einfaldlega ekki nennt að bæta við stuðningnum.

5. reglan er nokkuð heimskuleg og virðist ekki þjóna neinum tilgangi nema til að takmarka fjölda samsetninga. Af hverju mega lykilorð ekki byrja á tölustaf? Er það til að koma í veg fyrir að einhver geti sett lykilorð sem eru eingöngu tölustafir? Með því að hafa ekki slíka takmörkun væri bankinn að tefja ferli ræningjanna með því að láta þá prófa fleiri samsetningar en þeir þurfa. Ræningjarnir myndu auðvitað láta forritið prófa öll lykilorð sem reglurnar leyfa og þar á meðal lykilorð sem væru eingöngu tölustafir. Með því að setja þessa reglu hefur Landsbankanum tekist að auðvelda verk ræningjanna því það mun taka þá töluvert styttri tíma en ella. Til samanburðar myndi þessi regla orsaka það að ræningjarnir væru næstum helmingi fljótari að komast að 16 stafa lykilorði en ef reglan væri ekki í gildi.

Tilgangur 6. reglunnar er líklegast til að koma í veg fyrir of margar endurtekningar á sama staf. En eins og 5. reglan er hér bara um sýndaröryggi að ræða. Mögulegum samsetningum fækkar en þó má deila um það hvort það borgi sig fyrir ræningjana að innleiða þessa reglu en það fer aðallega eftir því hversu langan tíma hver tilraun tekur og hversu mikið vinnslan eykst ef reglan er innleidd í forritið. Þó er betra að eyða vafanum og láta ræningjana þjást aðeins meira.

Lykilorðastefna Landsbankans á heima í fortíðinni og óska ég hér með eftir hann taki upp vitræna stefnu sem fyrst.

Lokaverkefnið mitt í tölvunarfræði

Hér er rannsóknarskýrslan sem ég sendi inn vegna lokaverkefnisins míns í tölvunarfræði hjá Háskólanum í Reykjavík.

Stutt lýsing:
Í þessu verkefni var málheildin Íslenskur Orðasjóður, sem samanstendur af u.þ.b. 250 milljón orðmyndum, mörkuð og þáttuð á vélrænan hátt. Þess konar greining hefur ekki verið framkvæmd áður á jafn stóru safni íslenskra setninga.

Research report – final

Niðurhalsstefna Símans og Vodafone

Eftir að ég rakst á ásakanir um að stefna Símans um erlent niðurhal væri fáránleg, þá gat ég ekki staðist það að skrifa um það. Að mínu mati er stefna Símans miklu betri en sú sem Vodafone er með.

1. Síminn núllstillir ekki niðurhalið um hver mánaðarmót
Vodafone er með þá stefnu að tölur um erlent niðurhal núllstillist um hver mánaðarmót en á móti er Síminn með þá stefnu að miða alltaf við seinustu 30 daga. Munurinn sem um ræðir felst í viðurlögunum ef viðskiptavinurinn fer yfir það takmark. Skýri það í öðrum lið.

2. Viðurlög ef farið er yfir takmörk í erlendu niðurhali
Hér er stór sanngirnismunur þar sem Síminn fær stóran plús fram yfir Vodafone. Hjá Símanum er hraði viðskiptavinar frá útlöndum lækkaður þar til niðurhalsmagn seinustu 30 daga er neðar en 40 GB. Aðra sögu er að segja um Vodafone. Þar er allt erlent niðurhal skorið niður. Viðskiptavinurinn fær ekkert aðgengi út fyrir landið þar til mánuðurinn er liðinn. Ímyndaðu þér ef þú ferð yfir takmarkið, jafnvel örlítið yfir það, þegar það eru margir dagar eftir af mánuðnum. Það er svo lítið af innlendu afþreyingarefni að það er alveg eins hægt að sleppa því að nota Internetið.

3. Af hverju stefna Símans er betri varðandi hraða til og frá útlöndum
Það sem Vodafone er að gera er að hver sem ætlar að nýta þessi inniföldu 40 GB (áður 80 GB) mun auðvitað niðurhala þeim á seinustu dögum mánaðarins. Þetta veldur því, séu nógu margir sem hugsa þannig, að erlend umferð verður miklu verri fyrir vikið þá dagana. Stefna Símans er að því leiti miklu betri þar sem hún hvetur viðskiptavinina til þess að viðhalda ákveðnu meðaltali á umferð þ.e. að umferð seinustu 30 daga fari ekki yfir 40 GB. Jafnvel þótt farið sé yfir 40 gígabætin mun umferð elsta dagsins í viðmiðinu hverfa og sé hún þá fyrir neðan takmarkið mun fullur hraði vera mögulegur þar til farið er yfir takmarkið aftur.

4. Stefna Símans er ekki fullkomin
Auðvitað er hún ekki gallalaus. Ef viðskiptavinurinn ákveður að niðurhala rosalega miklu frá útlöndum á einum degi mun kerfið ekki fyrirgefa það fyrr en sá dagur er farinn úr viðmiðinu. En samt er stefna Símans betri en hjá Vodafone að þessu leyti. Síminn klippir ekki algerlega á erlenda umferð eins og Vodafone gerir svo að það er vel hægt að niðurhala frá útlöndum á þessu tímabili. Ef viðskiptavinurinn nær í 40 gígabæti á fyrsta degi mánaðarins, hjá hvorum aðilanum væri betra að vera? Svarið er augljóslega „hjá Símanum“.

Þessi rantur nær ekki yfir aðra netþjónustuaðila en Símann og Vodafone. Það getur vel verið að einhverjir aðrir bjóði upp á betri kjör en rétt skal vera rétt.