De 200 hyppigste danske ord.

Ordoptællingen er baseret på et tekstkorpus med over 1.6 millioner ord. Helt præcist 1.629.062 ord og 9.114.831 tegn.

Ordene kommer fra bøger af danske forfattere (så som Martin Strid, Agne Henningsen, Knud Romer, Jussi Adler Olsen, Kim Leine, Helle Helle, H.C. Andersen og Jane Aamund), danske medier (så som TV2, Politiken, Ekstrabladet og Jyllandsposten), danske film (så som Adams Æbler, Armadillo, Arven, Blinkende Lygter, Italiensk for begyndere, Pusher og Under Sandet) og flere andre samlinger af danske tekster (så som det danske Wikipedia).

Nogle af svaghederne ved optællingen er, at nogle værker er forholdsvis store. Derfor vil navne på hovedpersoner i en roman på 500 sider fremkomme langt hyppigere end noget nøgleord i 100 artikler tilsammen. Man kunne eksempelvis undre sig over, at ordet “døren” ligger nr. 187. Måske det er et tema i et af de større værker? I forlængelse heraf er artiklerne også fundet på dage, hvor emner eller enkeltpersoner har trukket hovedoverskrifter, og der vil derfor være en overvægt af populære ord fra denne dag. Eksempelvis fyldte “Brexit” samt “Grundwald” en del i artiklerne fra 15. november 2018, da Theresa May stod til at få et mistillidsvotum og Morten Grundwald gik bort samme dag. 

Det er min vurdering, at det er nødvendigt med et langt større tekstkorpus af artikler og andre danske tekster for at skabe en pålidelig oversigt større end de 200 hyppigste ord. Et tekstkorpus på 10 millioner ord ville være et godt sted at starte.

De 200 hyppigste ord

Første kolonne er ordets placering. I den næste er ordet samt antallet af gange, det forekommer ud af 1.6 millioner ord. Ordene står som de forekommer i alle tider og bøjninger, fx står både “er”, “var” og “været” på listen.

 

1 og – 51898
2 i – 38052
3 det – 36687
4 at – 30797
5 er – 26184
6 han – 25108
7 på – 24459
8 en – 23851
9 jeg – 23459
10 ikke – 21578
11 til – 21244
12 var – 19604
13 med – 18358
14 af – 17916
15 så – 17714
16 der – 17657
17 de – 15302
18 den – 15094
19 hun – 15003
20 for – 14351
21 som – 12202
22 et – 11350
23 har – 11292
24 sig – 10551
25 om – 10388
26 men – 10094
27 du – 9884
28 havde – 9237
29 vi – 7236
30 mig – 6860
31 kan – 6851
32 fra – 6734
33 ham – 6693
34 ved – 6441
35 ud – 5608
36 kunne – 5168
37 op – 5066
38 noget – 4988
39 nu – 4927
40 hvad – 4878
41 skal – 4871
42 siger – 4806
43 hende – 4749
44 da – 4380
45 over – 4341
46 sagde – 4199
47 hans – 3972
48 man – 3949
49 hvor – 3879
50 være – 3824
51 ville – 3816
52 vil – 3670
53 blev – 3506
54 ind – 3490
55 sin – 3463
56 også – 3437
57 dem – 3432
58 skulle – 3390
59 eller – 3273
60 efter – 3169
61 side – 3013
62 her – 2988
63 min – 2949
64 meget – 2859
65 bare – 2801
66 have – 2798
67 selv – 2786
68 hendes – 2785
69 godt – 2740
70 jo – 2677
71 når – 2658
72 lige – 2650
73 se – 2634
74 ned – 2603
75 lidt – 2562
76 dig – 2541
77 far – 2469
78 hvis – 2440
79 kom – 2436
80 går – 2382
81 mod – 2346
82 alle – 2296
83 kommer – 2226
84 to – 2224
85 bliver – 2094
86 få – 2022
87 må – 2022
88 mere – 1998
89 tilbage – 1971
90 igen – 1960
91 nok – 1907
92 mor – 1904
93 været – 1873
94 måske – 1846
95 sammen – 1840
96 helt – 1819
97 os – 1803
98 deres – 1796
99 ser – 1789
100 sådan – 1780
101 alt – 1761
102 gik – 1742
103 end – 1698
104 mand – 1642
105 gang – 1638
106 hele – 1626
107 fik – 1617
108 kun – 1592
109 nogle – 1566
110 lille – 1562
111 ingen – 1514
112 år – 1513
113 under – 1510
114 sit – 1505
115 gå – 1491
116 får – 1478
117 stod – 1465
118 uden – 1453
119 ja – 1451
120 siden – 1450
121 før – 1444
122 anden – 1432
123 blive – 1406
124 mange – 1406
125 nogen – 1386
126 andre – 1367
127 mens – 1362
128 gøre – 1356
129 hen – 1349
130 par – 1333
131 dag – 1306
132 sige – 1303
133 komme – 1295
134 tog – 1261
135 frem – 1259
136 gør – 1242
137 tror – 1227
138 sine – 1223
139 hjem – 1207
140 står – 1200
141 aldrig – 1199
142 samme – 1195
143 ad – 1195
144 hvordan – 1194
145 denne – 1184
146 tager – 1163
147 tid – 1142
148 andet – 1134
149 tage – 1131
150 store – 1127
151 måtte – 1121
152 hovedet – 1092
153 blevet – 1082
154 altid – 1061
155 nej – 1026
156 første – 1013
157 hos – 1006
158 din – 977
159 rundt – 963
160 flere – 959
161 spurgte – 948
162 vidste – 945
163 vores – 943
164 dette – 938
165 mit – 923
166 mellem – 901
167 sidste – 899
168 gjorde – 897
169 fordi – 893
170 sad – 893
171 sidder – 888
172 set – 876
173 fået – 872
174 lå – 859
175 spørger – 857
176 hvorfor – 855
177 sted – 845
178 stadig – 844
179 ligger – 842
180 gennem – 840
181 først – 840
182 mine – 839
183 trak – 832
184 gamle – 812
185 bag – 802
186 endnu – 797
187 døren – 793
188 hvem – 792
189 væk – 790
190 gerne – 789
191 hver – 789
192 vel – 788
193 ude – 770
194 hinanden – 767
195 gange – 760
196 inde – 756
197 øjne – 751
198 folk – 748
199 hentet – 744
200 tre – 743