Ooo, så långa ordVid Den heliga treenighetens katedral i Alexander Nevski-klostret i Petersburg finns en märklig kyrkogård. Eller egentligen flera. De flesta turister vallas runt närmast ingången till klostret, där konstnärer, författare, adel och andra berömdheter från 1800-talet ligger begravda. Men längre in på området, just utanför själva till katedralen, finns märkligare gravar. Här började bolsjevikerna på 20-talet begrava stupade revolutionärer - och inte bara kristna. I stort sett på tröskeln till katedralen finns flera muslimska gravar, prydda med halvmånar i stället för kors, vilket rimligen måste ha varit en medveten provokation från de nya ledarna mot den gamla religionen. Men även de andra minnesmärkena avviker: flera har en ilsket lysande röd stjärna på toppen. Många har små, svartvita foton av unga män i läderjackor och keps; man kan läsa inskrifter att de döda var "förare på pansartåget nr 5 uppkallat efter Lenin", eller "mördad av kontrarevolutionärerna", eller på en till och med det hatade "politruk". De tidiga gravarna, från tjugotalet, har definitivt icke-traditionell design,i svart plåt, smått futuristiska eller konstruktivistiska. Men efter hand blir gravmonumenten allt större, allt mer klassicistiska och kitschiga: tung granit och imiterade grekiska kolonner. De döda får allt imposantare titlar; och inskriptionerna ändrar också karaktär. Här hyllas Stalins stövelslickare, de som inte hamnade i Gulag, som "väktare av den marxistiska ideologins renhet". På ett av monumenten prisas en partikoryfé för sin "oboronosposobnost" - skicklighet i att försvara (partiet, förstås). Titta på det ordet! Sjutton bokstäver (plus ett litet mjuktecken som knappt räknas) - och det använder bara ett enda vokaltecken (o)! Vad är det längsta ord på svenska, som du kan komma på, som bara använder ett och samma vokaltecken? Ett ord där användningen kan beläggas, inte något konstruerat? Jag kom upp i nio, tio, möjligen tolv. Men så snubblade jag plötsligt över ett som också var just sjutton bokstäver långt, med bara en enda vokal. Hur långt kommer du? Litet pris till den som hittar det längsta. Större pris om du överträffar 17... Uppdatering: En bild på ordet - och gravstenen - har jag sent omsider lagt upp! (5 jan 2006) Uppdatering 2: Monovokal toppnotering tangerad: Sportskosponsor (25 aug 2007) Permalänk | |
21 aug 2003
|
> ett oändligt långt
Det ska vara en matematiker att hitta det förstås!
Hur är fördelningen bland de 8150, vad gäller ordens längd?
Har du tvåstaviga som nedre gräns - alla enstaviga är ju definitionsmässigt monovokala?
Sen kan man ju kolla vilka ord som är mest "ekonomiska": längst ord med minst material, dvs kvoten mellan total längd och antalet unika tecken.
"trolldomskonst" är inte så ekonomiskt (1,75).
"meddelelsemedel" kommer upp i 3. Finns det något som slår det?
Nedantående värden bör nog tas med en viss nypa salt. Det beror ju på exakt vilka ord som finns med i den ordlista som jag använder. Vissa ord kan möjligen ses som lite tvivelaktiga.
Fördelning av ordlängderna på monovokala ord
Längd på ordet: antal ord
--------------------------
2: 114
3: 715
4: 1593
5: 1463
6: 1040
7: 942
8: 988
9: 608
10: 360
11: 172
12: 87
13: 44
14: 15
15: 2
16: 1
17: 2
Effektivitetskvot
=================
När det gäller effektiviteskvoten förstår jag inte riktigt hur du kom fram till värdet 1.75 för "trolldomskonst".
Som jag förstår din funktion är det
total längd / antalet unika tecken
dvs för "trolldomskonst":
14 / 9 = 1.56
De unika tecknen är, sorterade,
d k l m n o r s t
För "meddelelsemedel" är det dock samma som du
15 / 5 = 3.0
Vad har jag missat?
Om man använder ovanstående effektivitetsfunktion så har vi nedanstående vinnare, där många är repeterande ord.
Ord: Effektivitetskvot (ordlängd)
---------------------------------
lullull: 3.50 (len: 7)
sonsonsson: 3.33 (len: 10)
hihihi: 3.00 (len: 6)
lalala: 3.00 (len: 6)
meddelelsemedel: 3.00 (len: 15)
cha-cha-cha: 2.75 (len: 11)
gonggong: 2.67 (len: 8)
töfftöff: 2.67 (len: 8)
piripiri: 2.67 (len: 8)
matmamma: 2.67 (len: 8)
barnbarnsbarn: 2.60 (len: 13)
annan: 2.50 (len: 5)
mamma: 2.50 (len: 5)
farfarsfar: 2.50 (len: 10)
lalla: 2.50 (len: 5)
pippi: 2.50 (len: 5)
statskassa: 2.50 (len: 10)
gagga: 2.50 (len: 5)
dadda: 2.50 (len: 5)
annanstans: 2.50 (len: 10)
statsskatt: 2.50 (len: 10)
pappa: 2.50 (len: 5)
ingnidning: 2.50 (len: 10)
inringning: 2.50 (len: 10)
mormorsmor: 2.50 (len: 10)
gissningsvis: 2.40 (len: 12)
statsapparat: 2.40 (len: 12)
_Fördelningen_ av effektivitetskvoten, med en decimal, är:
Kvot: antal ord med denna kvot
------------------------------
1.0: 2451
1.1: 271
1.2: 1825
1.3: 1237
1.4: 606
1.5: 674
1.6: 341
1.7: 299
1.8: 240
1.9: 6
2.0: 143
2.1: 1
2.2: 17
2.3: 8
2.4: 2
2.5: 14
2.6: 1
2.7: 4
2.8: 1
3.0: 3
3.3: 1
3.5: 1
Reservation för eventuellt hjärnsläpp denna relativt sena timme.
Jag hade missat ett tecken i trolldomskonst. 14/8 = 1.75
En annan kvot kunde vara vokalrikedomen (vokaltecken genom längd). Lullull har bara 2/7 = 0,29.
Meddelelsemedel har 6/17 = 0,35
oboronosposobnost har 7/17 = 0,41
Fast lalala och hihihi får förstås 0,5!
(Hm, vad nu det här ska vara bra för...)
Från: Jonas | Skickat vid: 10:52, 21 augusti 2003Jag upptäcker att jag har tagit med vissa ord som inte borde vara med eller är dubiösa (t.ex. 'a-barn'), vilket påverkar de visade fördelningarna. Vid tillfälle kommer detta att justeras (troligen på min sajt).
Nedanstående bygger på samma material som tidigare.
Här är fördelningen på hur många ord som använder vilken vokal.
Vokal: antal ord
----------------
a: 3137
e: 791
i: 1299
o: 960
u: 625
y: 192
ä: 590
å: 280
ö: 272
Vokalrikedom
------------
Några av de med högst vokalrikedom.
ene: 0.67
axa: 0.67
åhå: 0.67
apa: 0.67
oro: 0.67
asa: 0.67
ara: 0.67
aha: 0.67
voodoo: 0.67
eke: 0.67
aga: 0.67
zoo: 0.67
eeg: 0.67
ana: 0.67
och lägst (naturligtvis är det en-vokalorden).
borsjtj: 0.14
bransch: 0.14
sprängd: 0.14
Du frågar vad detta är bra för. Det är ett skoj problem, det räcker i alla fall för mig...
Man kan ju fundera på hur språk skiljer sig på den här punkten.
Svenskan är ett vokalrikt språk - vilket borde minska sannolikheten för långa monovokala ord.
Å andra sidan gör vi sammansättningar, och kan tolerera ganska långa konsonantkluster, vilket kan ge oss ganska långa ord.
Förmodligen ligger vi då nånstans i mitten av skalan.
Mest monovokalism kan man förmodligen hitta i vokalfattiga språk som har agglutinerande drag. Kanske i swahili, turkiska, eskimåspråk, eller några polynesiska språk (om jag gissar på en höft).
Från: Jonas | Skickat vid: 11:52, 21 augusti 2003Vet du om det finns någon koppling mellan vokalrikedom (eller längden på orden överhuvudtaget) och hur gammalt ett språk är?
Man skulle kunna tänka sig att ett nyare språk borde vara mera effektivt i någon mening, t.ex. antingen ha kortare ord eller enklare (mer effektiv) grammatik, eller ....
Apropå konstruktion av långa ord:
Markov Words II skulle kunna användas för detta.
http://www.hakank.org/new_markov_words/index2.html
Kort instruktion:
Skriv t.ex. in "domstolsprotokoll" i fältet "Source word", välj "Swedish words longer than 20 chars" i "Select language/dictionary" och välj "Reverse edit distance" i "Select metric". Klicka på "ok" som finns sist i formuläret.
Då skapas en ny sida med ett gäng ord som i bästa fall kan vara korrekta och ibland kan vara riktigt roliga. Men de är i alla fall långa.:-)
Vokallängd och "ålder" har säkerligen inget samband.
Det är nog tveksamt om man kan säga något om ett enskilt språks ålder på ett meningsfullt sätt. (Hur gammalt är engelska? När blev engelska engelska? Vad var det innan?)
Fast det finns ett resonemang om att språk utvecklas från att ha korta ord och fria grammatiska markeringar (isolerande språk - som kinesiska) - till att de fria markeringarna fogas ihop med sina lexikala morfem (som prefix eller suffix) och språket övergår till att bli agglutinerande. Sedan antas prefix och suffix nötas ner och smälta ihop med sina lexikala morfem och man får ett flekterande språk (som latin).
Så då skulle ett flekterande språk kunna ha genomgått en längre process än agglutinerande. Problemet är väl att man inte riktigt kan förklara varför det finns så många, uppenbarligen gamla, isolerande språk i Sydostasien som inte har genomgått denna förändring.
Från: Jonas | Skickat vid: 0:10, 22 augusti 2003Jag tyckte att anslagstavla var bra innan jag läste kommentarerna. Går man på stavning eller på uttal förresten? Det finns ett turkiskt fotbollslag som heter Galatasaray. 11 bokstäver, varannan är a.
Från: Mats Andersson | Skickat vid: 20:51, 23 augusti 2003Stavning!
Från: Jonas | Skickat vid: 1:27, 25 augusti 2003Attans! <- sex bokstäver
Från: Mats Andersson | Skickat vid: 9:07, 25 augusti 2003Vokaltecknen i svenska (och många andra språk) står för flera ljud - de två ljuden som betecknas med "o" i "trolldom" är t ex helt olika. Men vi är präglade av skriften och tänker sällan på det.
Det är klart att man kan försöka hitta ord med minimalt antal ljud (vokal-foner) - istället för minimalt antal tecken - också. Det torde vara ännu svårare, så den som tyckte det här var för lätt kan väl ta sig an det...
Jonas: Tävling med vokal-foner: Pass.
Fast om du har en elektronisk uttalsordlista att erbjuda, så är jag på.
Mats: Jig tridde di skilli tivli mid ird i i-sprikit, t.ix. riilisitiinsvinstbiskittningin (30) :-)
I min ordlista får jag följande serie med de(t) "hittills längsta orden/t". Det har dock inget som helst med vokal-tävlingen att göra.
6: abakus
7: abandon
9: abbedissa
11: abborrfiske abborrgrund abborrpinne abbotsstift
12: abbreviation abbreviering
14: abdikationsakt
15: abiturientklass abnormpsykologi abnormtillstånd
18: abonnemangsbiljett
24: abonnemangsföreställning
27: acklimatiseringssvårigheter förtjänstutvecklingsgaranti kontrollstationsförhandling
28: realisationsvinstbeskattning
Ji visst ji! I-spriket ir ji pirfikt fir sini hir tivlingir! :)
Från: Mats Andersson | Skickat vid: 16:17, 25 augusti 2003Det raeknas nog inte men eftersom jag kom paa det saa snabbt kan jag inte motstaa:
missisippiindivid: 18
jag tycker ocksaa om:
raaaaaal (rååål - ål från Råån - omskrivet som jag goer foer att undvika att anvaenda å, ä, och ö). Naagra bilder fraan råån http://w1.422.telia.com/~u42238838/bilderraan.htm
och lite fakta daerom http://mhtf.se/moh/vatmark.htm .
om det finns ål från råån vet jag inte, men min far brukade saega att det var det svenska ordet med flest vokaler i foeljd. Han paastod ocksaa att det fanns en plats i Danmark som hetter Raa (vilket alltsaa innebaer att man inte behoever skriva om det.).
Från: Pehr Jansson | Skickat vid: 17:10, 25 augusti 2003Pehr: bra - kan du belägga det i text är väl trofén din...
Apropå Danmark finns det en kommun eller samhälle på Jylland som heter Gravens; det var varmt i bilen och det hade inte varit fel att sträcka på benen, ändå vågade vi inte svänga av när skylten "Gravens rastplats" dök upp vid vägkanten.
Från: Jonas | Skickat vid: 0:34, 26 augusti 2003""Meddelelsemedlens" aer nog i ingen fara. Det går troligen inte att belägga mitt ord - paa internet kunde jag bara hitta "individomsorg" som sammansatt ord med individ. Fuskar man ("konstruerade") kanske man kan komma paa maanga ord som aer liknande, I concede defeat.
Laat mig foereslaa att en ny gren i den haer sporten: att hitta baesta multivokala ord. Paa engelska finns det ett ord som har varje vokal precis en gaang och dessutom i alfabetisk ordning: facetiously. slänger man sen i å, ä och ö, faar man en vaeldigt stor kombinations moejlighet. Jag kallar "facetiously" det perfekta multivokala ordet. varje vokal, precis en gaang, och i alfabetisk ordning. Med ytterligare tre vokaler blir det nog mycket svaarare att hitta ett perfekt multivokalt ord paa svenska.
Från: Pehr Jansson | Skickat vid: 15:31, 26 augusti 2003TORSDAGSMATSEDELSUPPLÄSNINGSPRIVATASSISTENT är ett långt ord !
Från: Robin Sahlén | Skickat vid: 19:02, 24 oktober 2003Jag vann...
Flaggstångsknoppsputspoleringsmedelsflaskskorksetikettspåklistrare = 66 bokstäver!!!
Ha en go helg och andasin djupt innan ni försöker läsa ovanstående!
Life's to short to ride longboard...
Från: Goodtime Fred | Skickat vid: 16:11, 16 januari 2004det måste väll finnas längre???
flagsstångsknoppsmaskinskötaruniformssymaskiistlärlingshatt
Från: johan | Skickat vid: 19:25, 29 januari 2004Okej, nu är det såhär, att jag hade tråkigt...
HäxnäsvårtsinnehållsutklämmarapparatsgriptångshandtagsmaterialsatommassevågsplatåmetallsrostsyresomsättareshållaresfärgvalsblandaresetikettemballagefrigolittillverkareslagerlokalsmaskinföraresfordonstopplockfästesmaterialsunderhållaresservicedelstillverkarföretagetsombudsmansmatlådelocksgångjärnsihopsättarmaskinsoljedistrubitörsutsläppskonsekvenskonfliktersdiskussionsdebattsoffesittarnasstjärtslickarorgieklubbsVIPkortsförfalskarserieschefsjobbslönetagarpersonsklockvisarmetallsgruvarbetarförbundsmedlemmeförmånersinnehållsförteckningsregistersförfattardatabashanterarsoperativsystemutvecklargruppssamordnarchefstyngdpunktsnegationsgrivationsmätarinstrumentdrivgasbehållarestryckmätarnål
Från: Simeon Albertson | Skickat vid: 14:41, 15 mars 2004Häxnäsvårtsinnehållsutklämmarapparatsgriptångshand-
tagsmaterialsatommassevågsplatåmetallsrostsyresoms-
ättareshållaresfärgvalsblandaresetikettemballagefr-
igolittillverkareslagerlokalsmaskinföraresfordonst-
opplockfästesmaterialsunderhållaresservicedelstill-
verkarföretagetsombudsmansmatlådelocksgångjärnsiho-
psättarmaskinsoljedistrubitörsutsläppskonsekvensko-
nfliktersdiskussionsdebattsoffesittarnasstjärtslic-
karorgieklubbsVIPkortsförfalskarserieschefsjobbslö-
netagarpersonsklockvisarmetallsgruvarbetarförbunds-
medlemmeförmånersinnehållsförteckningsregistersför-
fattardatabashanterarsoperativsystemutvecklargrupp-
ssamordnarchefstyngdpunktsnegationsgrivationsmätar-
instrumentdrivgasbehållarestryckmätarnål
Den nålen vill jag ha i födelsedagspresent...
Från: Simeon Albertson | Skickat vid: 14:46, 15 mars 2004alltså.. vet ju inte hur petiga folk e med långa ord och så... men de här orden är ju definitivt mer seriösa än de sista orden här förinnan...
röntgensjuksköterskeutbildningen =32
eller den lite mer tveksamme:
sjukfrånvaroanmälningstelefonsvararen = 37
[Den kommentar från "Robin" som fanns här har tagits bort av Jonas, eftersom den sänkte samtalsnivån utan att tillföra något. Håll er till god ton och visa ett gott sinnelag, pojkar.]
Från: Robin | Skickat vid: 22:31, 29 juni 2004[Den kommentar som fanns här har tagits bort av Jonas, eftersom den sänkte samtalsnivån utan att tillföra något. Håll er till god ton och visa ett gott sinnelag, pojkar.]
Från: En arg medborgare | Skickat vid: 23:16, 29 juni 2004[Denna notis har tillfälligt stängts för inlägg. Den kommentar av "Råger Grindsäter" som fanns här har tagits bort av Jonas. Det här är min blogg, pojkar, inte ett klotterplank.Håll er till god ton, visa ett gott sinnelag, och ta ert gnabb någon annanstans.]
Från: Råger Grindsäter | Skickat vid: 23:28, 29 juni 2004På kornet | Korn av sanning | Guldkorn | Blind höna | Skrot och korn | Väderkorn |
Jag hittade ett oändligt långt:
barnbarnsbarnsbarnsbarnsbarns....
:-)
Mer riktiga ord (antal tecken efter ":")
tillfriskningstid: 17
domstolsprotokoll: 17
rättshjälpsnämnd: 16
partssammansatt: 15
meddelelsemedel: 15
Några lite kortare favoriter:
trolldomskonst: 14
primitivistisk: 14
Det finns förvånansvärt många sådana "monovokala" ord, nämligen cirka 8150. Säg till om du är intresserad av den fullståndiga listan för då publicerar jag den.
Från: Håkan Kjellerstrand | Skickat vid: 0:30, 21 augusti 2003