Kommentarer: Ooo, så långa ord

Jag hittade ett oändligt långt:
barnbarnsbarnsbarnsbarnsbarns....
:-)

Mer riktiga ord (antal tecken efter ":")
tillfriskningstid: 17
domstolsprotokoll: 17
rättshjälpsnämnd: 16
partssammansatt: 15
meddelelsemedel: 15

Några lite kortare favoriter:
trolldomskonst: 14
primitivistisk: 14

Det finns förvånansvärt många sådana "monovokala" ord, nämligen cirka 8150. Säg till om du är intresserad av den fullståndiga listan för då publicerar jag den.

Kommentar från Håkan Kjellerstrand, augusti 21, 2003 12:30 FM

> ett oändligt långt

Det ska vara en matematiker att hitta det förstås!

Hur är fördelningen bland de 8150, vad gäller ordens längd?
Har du tvåstaviga som nedre gräns - alla enstaviga är ju definitionsmässigt monovokala?

Sen kan man ju kolla vilka ord som är mest "ekonomiska": längst ord med minst material, dvs kvoten mellan total längd och antalet unika tecken.
"trolldomskonst" är inte så ekonomiskt (1,75).
"meddelelsemedel" kommer upp i 3. Finns det något som slår det?

Kommentar från Jonas, augusti 21, 2003 01:27 FM

Nedantående värden bör nog tas med en viss nypa salt. Det beror ju på exakt vilka ord som finns med i den ordlista som jag använder. Vissa ord kan möjligen ses som lite tvivelaktiga.

Fördelning av ordlängderna på monovokala ord

Längd på ordet: antal ord
--------------------------
2: 114
3: 715
4: 1593
5: 1463
6: 1040
7: 942
8: 988
9: 608
10: 360
11: 172
12: 87
13: 44
14: 15
15: 2
16: 1
17: 2


Effektivitetskvot
=================
När det gäller effektiviteskvoten förstår jag inte riktigt hur du kom fram till värdet 1.75 för "trolldomskonst".

Som jag förstår din funktion är det
total längd / antalet unika tecken
dvs för "trolldomskonst":
14 / 9 = 1.56
De unika tecknen är, sorterade,
d k l m n o r s t

För "meddelelsemedel" är det dock samma som du
15 / 5 = 3.0

Vad har jag missat?

Om man använder ovanstående effektivitetsfunktion så har vi nedanstående vinnare, där många är repeterande ord.

Ord: Effektivitetskvot (ordlängd)
---------------------------------
lullull: 3.50 (len: 7)
sonsonsson: 3.33 (len: 10)
hihihi: 3.00 (len: 6)
lalala: 3.00 (len: 6)
meddelelsemedel: 3.00 (len: 15)
cha-cha-cha: 2.75 (len: 11)
gonggong: 2.67 (len: 8)
töfftöff: 2.67 (len: 8)
piripiri: 2.67 (len: 8)
matmamma: 2.67 (len: 8)
barnbarnsbarn: 2.60 (len: 13)
annan: 2.50 (len: 5)
mamma: 2.50 (len: 5)
farfarsfar: 2.50 (len: 10)
lalla: 2.50 (len: 5)
pippi: 2.50 (len: 5)
statskassa: 2.50 (len: 10)
gagga: 2.50 (len: 5)
dadda: 2.50 (len: 5)
annanstans: 2.50 (len: 10)
statsskatt: 2.50 (len: 10)
pappa: 2.50 (len: 5)
ingnidning: 2.50 (len: 10)
inringning: 2.50 (len: 10)
mormorsmor: 2.50 (len: 10)
gissningsvis: 2.40 (len: 12)
statsapparat: 2.40 (len: 12)

_Fördelningen_ av effektivitetskvoten, med en decimal, är:

Kvot: antal ord med denna kvot
------------------------------
1.0: 2451
1.1: 271
1.2: 1825
1.3: 1237
1.4: 606
1.5: 674
1.6: 341
1.7: 299
1.8: 240
1.9: 6
2.0: 143
2.1: 1
2.2: 17
2.3: 8
2.4: 2
2.5: 14
2.6: 1
2.7: 4
2.8: 1
3.0: 3
3.3: 1
3.5: 1


Reservation för eventuellt hjärnsläpp denna relativt sena timme.

Kommentar från Håkan Kjellerstrand, augusti 21, 2003 02:30 FM

Jag hade missat ett tecken i trolldomskonst. 14/8 = 1.75

En annan kvot kunde vara vokalrikedomen (vokaltecken genom längd). Lullull har bara 2/7 = 0,29.
Meddelelsemedel har 6/17 = 0,35
oboronosposobnost har 7/17 = 0,41

Fast lalala och hihihi får förstås 0,5!

(Hm, vad nu det här ska vara bra för...)

Kommentar från Jonas, augusti 21, 2003 10:52 FM

Jag upptäcker att jag har tagit med vissa ord som inte borde vara med eller är dubiösa (t.ex. 'a-barn'), vilket påverkar de visade fördelningarna. Vid tillfälle kommer detta att justeras (troligen på min sajt).

Nedanstående bygger på samma material som tidigare.

Här är fördelningen på hur många ord som använder vilken vokal.

Vokal: antal ord
----------------
a: 3137
e: 791
i: 1299
o: 960
u: 625
y: 192
ä: 590
å: 280
ö: 272

Vokalrikedom
------------
Några av de med högst vokalrikedom.
ene: 0.67
axa: 0.67
åhå: 0.67
apa: 0.67
oro: 0.67
asa: 0.67
ara: 0.67
aha: 0.67
voodoo: 0.67
eke: 0.67
aga: 0.67
zoo: 0.67
eeg: 0.67
ana: 0.67

och lägst (naturligtvis är det en-vokalorden).
borsjtj: 0.14
bransch: 0.14
sprängd: 0.14


Du frågar vad detta är bra för. Det är ett skoj problem, det räcker i alla fall för mig...


Kommentar från Håkan Kjellerstrand, augusti 21, 2003 11:25 FM

Man kan ju fundera på hur språk skiljer sig på den här punkten.

Svenskan är ett vokalrikt språk - vilket borde minska sannolikheten för långa monovokala ord.

Å andra sidan gör vi sammansättningar, och kan tolerera ganska långa konsonantkluster, vilket kan ge oss ganska långa ord.

Förmodligen ligger vi då nånstans i mitten av skalan.

Mest monovokalism kan man förmodligen hitta i vokalfattiga språk som har agglutinerande drag. Kanske i swahili, turkiska, eskimåspråk, eller några polynesiska språk (om jag gissar på en höft).

Kommentar från Jonas, augusti 21, 2003 11:52 FM

Vet du om det finns någon koppling mellan vokalrikedom (eller längden på orden överhuvudtaget) och hur gammalt ett språk är?

Man skulle kunna tänka sig att ett nyare språk borde vara mera effektivt i någon mening, t.ex. antingen ha kortare ord eller enklare (mer effektiv) grammatik, eller ....


Apropå konstruktion av långa ord:
Markov Words II skulle kunna användas för detta.
http://www.hakank.org/new_markov_words/index2.html

Kort instruktion:
Skriv t.ex. in "domstolsprotokoll" i fältet "Source word", välj "Swedish words longer than 20 chars" i "Select language/dictionary" och välj "Reverse edit distance" i "Select metric". Klicka på "ok" som finns sist i formuläret.

Då skapas en ny sida med ett gäng ord som i bästa fall kan vara korrekta och ibland kan vara riktigt roliga. Men de är i alla fall långa.:-)


Kommentar från Håkan Kjellerstrand, augusti 21, 2003 12:19 EM

Vokallängd och "ålder" har säkerligen inget samband.
Det är nog tveksamt om man kan säga något om ett enskilt språks ålder på ett meningsfullt sätt. (Hur gammalt är engelska? När blev engelska engelska? Vad var det innan?)

Fast det finns ett resonemang om att språk utvecklas från att ha korta ord och fria grammatiska markeringar (isolerande språk - som kinesiska) - till att de fria markeringarna fogas ihop med sina lexikala morfem (som prefix eller suffix) och språket övergår till att bli agglutinerande. Sedan antas prefix och suffix nötas ner och smälta ihop med sina lexikala morfem och man får ett flekterande språk (som latin).

Så då skulle ett flekterande språk kunna ha genomgått en längre process än agglutinerande. Problemet är väl att man inte riktigt kan förklara varför det finns så många, uppenbarligen gamla, isolerande språk i Sydostasien som inte har genomgått denna förändring.

Kommentar från Jonas, augusti 22, 2003 12:10 FM

Jag tyckte att anslagstavla var bra innan jag läste kommentarerna. Går man på stavning eller på uttal förresten? Det finns ett turkiskt fotbollslag som heter Galatasaray. 11 bokstäver, varannan är a.

Kommentar från Mats Andersson, augusti 23, 2003 08:51 EM

Stavning!

Kommentar från Jonas, augusti 25, 2003 01:27 FM

Attans! <- sex bokstäver

Kommentar från Mats Andersson, augusti 25, 2003 09:07 FM

Vokaltecknen i svenska (och många andra språk) står för flera ljud - de två ljuden som betecknas med "o" i "trolldom" är t ex helt olika. Men vi är präglade av skriften och tänker sällan på det.

Det är klart att man kan försöka hitta ord med minimalt antal ljud (vokal-foner) - istället för minimalt antal tecken - också. Det torde vara ännu svårare, så den som tyckte det här var för lätt kan väl ta sig an det...

Kommentar från jonas, augusti 25, 2003 09:54 FM

Jonas: Tävling med vokal-foner: Pass.

Fast om du har en elektronisk uttalsordlista att erbjuda, så är jag på.


Mats: Jig tridde di skilli tivli mid ird i i-sprikit, t.ix. riilisitiinsvinstbiskittningin (30) :-)


I min ordlista får jag följande serie med de(t) "hittills längsta orden/t". Det har dock inget som helst med vokal-tävlingen att göra.

6: abakus
7: abandon
9: abbedissa
11: abborrfiske abborrgrund abborrpinne abbotsstift
12: abbreviation abbreviering
14: abdikationsakt
15: abiturientklass abnormpsykologi abnormtillstånd
18: abonnemangsbiljett
24: abonnemangsföreställning
27: acklimatiseringssvårigheter förtjänstutvecklingsgaranti kontrollstationsförhandling
28: realisationsvinstbeskattning

Kommentar från Håkan Kjellerstrand, augusti 25, 2003 03:33 EM

Ji visst ji! I-spriket ir ji pirfikt fir sini hir tivlingir! :)

Kommentar från Mats Andersson, augusti 25, 2003 04:17 EM

Det raeknas nog inte men eftersom jag kom paa det saa snabbt kan jag inte motstaa:

missisippiindivid: 18

jag tycker ocksaa om:

raaaaaal (rååål - ål från Råån - omskrivet som jag goer foer att undvika att anvaenda å, ä, och ö). Naagra bilder fraan råån http://w1.422.telia.com/~u42238838/bilderraan.htm
och lite fakta daerom http://mhtf.se/moh/vatmark.htm .

om det finns ål från råån vet jag inte, men min far brukade saega att det var det svenska ordet med flest vokaler i foeljd. Han paastod ocksaa att det fanns en plats i Danmark som hetter Raa (vilket alltsaa innebaer att man inte behoever skriva om det.).

Kommentar från Pehr Jansson, augusti 25, 2003 05:10 EM

Pehr: bra - kan du belägga det i text är väl trofén din...

Apropå Danmark finns det en kommun eller samhälle på Jylland som heter Gravens; det var varmt i bilen och det hade inte varit fel att sträcka på benen, ändå vågade vi inte svänga av när skylten "Gravens rastplats" dök upp vid vägkanten.

Kommentar från Jonas, augusti 26, 2003 12:34 FM

""Meddelelsemedlens" aer nog i ingen fara. Det går troligen inte att belägga mitt ord - paa internet kunde jag bara hitta "individomsorg" som sammansatt ord med individ. Fuskar man ("konstruerade") kanske man kan komma paa maanga ord som aer liknande, I concede defeat.

Laat mig foereslaa att en ny gren i den haer sporten: att hitta baesta multivokala ord. Paa engelska finns det ett ord som har varje vokal precis en gaang och dessutom i alfabetisk ordning: facetiously. slänger man sen i å, ä och ö, faar man en vaeldigt stor kombinations moejlighet. Jag kallar "facetiously" det perfekta multivokala ordet. varje vokal, precis en gaang, och i alfabetisk ordning. Med ytterligare tre vokaler blir det nog mycket svaarare att hitta ett perfekt multivokalt ord paa svenska.

Kommentar från Pehr Jansson, augusti 26, 2003 03:31 EM

TORSDAGSMATSEDELSUPPLÄSNINGSPRIVATASSISTENT är ett långt ord !

Kommentar från Robin Sahlén, oktober 24, 2003 07:02 EM

Jag vann...
Flaggstångsknoppsputspoleringsmedelsflaskskorksetikettspåklistrare = 66 bokstäver!!!

Ha en go helg och andasin djupt innan ni försöker läsa ovanstående!

Life's to short to ride longboard...

Kommentar från Goodtime Fred, januari 16, 2004 04:11 EM

det måste väll finnas längre???

flagsstångsknoppsmaskinskötaruniformssymaskiistlärlingshatt

Kommentar från johan, januari 29, 2004 07:25 EM

Okej, nu är det såhär, att jag hade tråkigt...

HäxnäsvårtsinnehållsutklämmarapparatsgriptångshandtagsmaterialsatommassevågsplatåmetallsrostsyresomsättareshållaresfärgvalsblandaresetikettemballagefrigolittillverkareslagerlokalsmaskinföraresfordonstopplockfästesmaterialsunderhållaresservicedelstillverkarföretagetsombudsmansmatlådelocksgångjärnsihopsättarmaskinsoljedistrubitörsutsläppskonsekvenskonfliktersdiskussionsdebattsoffesittarnasstjärtslickarorgieklubbsVIPkortsförfalskarserieschefsjobbslönetagarpersonsklockvisarmetallsgruvarbetarförbundsmedlemmeförmånersinnehållsförteckningsregistersförfattardatabashanterarsoperativsystemutvecklargruppssamordnarchefstyngdpunktsnegationsgrivationsmätarinstrumentdrivgasbehållarestryckmätarnål

Kommentar från Simeon Albertson, mars 15, 2004 02:41 EM

Häxnäsvårtsinnehållsutklämmarapparatsgriptångshand-
tagsmaterialsatommassevågsplatåmetallsrostsyresoms-
ättareshållaresfärgvalsblandaresetikettemballagefr-
igolittillverkareslagerlokalsmaskinföraresfordonst-
opplockfästesmaterialsunderhållaresservicedelstill-
verkarföretagetsombudsmansmatlådelocksgångjärnsiho-
psättarmaskinsoljedistrubitörsutsläppskonsekvensko-
nfliktersdiskussionsdebattsoffesittarnasstjärtslic-
karorgieklubbsVIPkortsförfalskarserieschefsjobbslö-
netagarpersonsklockvisarmetallsgruvarbetarförbunds-
medlemmeförmånersinnehållsförteckningsregistersför-
fattardatabashanterarsoperativsystemutvecklargrupp-
ssamordnarchefstyngdpunktsnegationsgrivationsmätar-
instrumentdrivgasbehållarestryckmätarnål

Den nålen vill jag ha i födelsedagspresent...

Kommentar från Simeon Albertson, mars 15, 2004 02:46 EM

alltså.. vet ju inte hur petiga folk e med långa ord och så... men de här orden är ju definitivt mer seriösa än de sista orden här förinnan...

röntgensjuksköterskeutbildningen =32

eller den lite mer tveksamme:
sjukfrånvaroanmälningstelefonsvararen = 37

Kommentar från Alexander, april 12, 2004 11:18 EM

[Den kommentar från "Robin" som fanns här har tagits bort av Jonas, eftersom den sänkte samtalsnivån utan att tillföra något. Håll er till god ton och visa ett gott sinnelag, pojkar.]

Kommentar från Robin, juni 29, 2004 10:31 EM

[Den kommentar som fanns här har tagits bort av Jonas, eftersom den sänkte samtalsnivån utan att tillföra något. Håll er till god ton och visa ett gott sinnelag, pojkar.]

Kommentar från En arg medborgare, juni 29, 2004 11:16 EM

[Denna notis har tillfälligt stängts för inlägg. Den kommentar av "Råger Grindsäter" som fanns här har tagits bort av Jonas. Det här är min blogg, pojkar, inte ett klotterplank.Håll er till god ton, visa ett gott sinnelag, och ta ert gnabb någon annanstans.]

Kommentar från Råger Grindsäter, juni 29, 2004 11:28 EM

Skriv en egen kommentar:
Namn:


Mejladress:


URL (webblog, hemsida etc):
Webadresser i ditt inlägg blir automatiskt länkar om du skriver dem som http://www.url.com


Kommentar:


Kom ihåg personuppgifter