De 200 hyppigste danske ord.
Ordoptællingen er baseret på et tekstkorpus med over 1.6 millioner ord. Helt præcist 1.629.062 ord og 9.114.831 tegn.
Ordene kommer fra bøger af danske forfattere (så som Martin Strid, Agne Henningsen, Knud Romer, Jussi Adler Olsen, Kim Leine, Helle Helle, H.C. Andersen og Jane Aamund), danske medier (så som TV2, Politiken, Ekstrabladet og Jyllandsposten), danske film (så som Adams Æbler, Armadillo, Arven, Blinkende Lygter, Italiensk for begyndere, Pusher og Under Sandet) og flere andre samlinger af danske tekster (så som det danske Wikipedia).
Nogle af svaghederne ved optællingen er, at nogle værker er forholdsvis store. Derfor vil navne på hovedpersoner i en roman på 500 sider fremkomme langt hyppigere end noget nøgleord i 100 artikler tilsammen. Man kunne eksempelvis undre sig over, at ordet “døren” ligger nr. 187. Måske det er et tema i et af de større værker? I forlængelse heraf er artiklerne også fundet på dage, hvor emner eller enkeltpersoner har trukket hovedoverskrifter, og der vil derfor være en overvægt af populære ord fra denne dag. Eksempelvis fyldte “Brexit” samt “Grundwald” en del i artiklerne fra 15. november 2018, da Theresa May stod til at få et mistillidsvotum og Morten Grundwald gik bort samme dag.
Det er min vurdering, at det er nødvendigt med et langt større tekstkorpus af artikler og andre danske tekster for at skabe en pålidelig oversigt større end de 200 hyppigste ord. Et tekstkorpus på 10 millioner ord ville være et godt sted at starte.
De 200 hyppigste ord
Første kolonne er ordets placering. I den næste er ordet samt antallet af gange, det forekommer ud af 1.6 millioner ord. Ordene står som de forekommer i alle tider og bøjninger, fx står både “er”, “var” og “været” på listen.
1 | og – 51898 |
2 | i – 38052 |
3 | det – 36687 |
4 | at – 30797 |
5 | er – 26184 |
6 | han – 25108 |
7 | på – 24459 |
8 | en – 23851 |
9 | jeg – 23459 |
10 | ikke – 21578 |
11 | til – 21244 |
12 | var – 19604 |
13 | med – 18358 |
14 | af – 17916 |
15 | så – 17714 |
16 | der – 17657 |
17 | de – 15302 |
18 | den – 15094 |
19 | hun – 15003 |
20 | for – 14351 |
21 | som – 12202 |
22 | et – 11350 |
23 | har – 11292 |
24 | sig – 10551 |
25 | om – 10388 |
26 | men – 10094 |
27 | du – 9884 |
28 | havde – 9237 |
29 | vi – 7236 |
30 | mig – 6860 |
31 | kan – 6851 |
32 | fra – 6734 |
33 | ham – 6693 |
34 | ved – 6441 |
35 | ud – 5608 |
36 | kunne – 5168 |
37 | op – 5066 |
38 | noget – 4988 |
39 | nu – 4927 |
40 | hvad – 4878 |
41 | skal – 4871 |
42 | siger – 4806 |
43 | hende – 4749 |
44 | da – 4380 |
45 | over – 4341 |
46 | sagde – 4199 |
47 | hans – 3972 |
48 | man – 3949 |
49 | hvor – 3879 |
50 | være – 3824 |
51 | ville – 3816 |
52 | vil – 3670 |
53 | blev – 3506 |
54 | ind – 3490 |
55 | sin – 3463 |
56 | også – 3437 |
57 | dem – 3432 |
58 | skulle – 3390 |
59 | eller – 3273 |
60 | efter – 3169 |
61 | side – 3013 |
62 | her – 2988 |
63 | min – 2949 |
64 | meget – 2859 |
65 | bare – 2801 |
66 | have – 2798 |
67 | selv – 2786 |
68 | hendes – 2785 |
69 | godt – 2740 |
70 | jo – 2677 |
71 | når – 2658 |
72 | lige – 2650 |
73 | se – 2634 |
74 | ned – 2603 |
75 | lidt – 2562 |
76 | dig – 2541 |
77 | far – 2469 |
78 | hvis – 2440 |
79 | kom – 2436 |
80 | går – 2382 |
81 | mod – 2346 |
82 | alle – 2296 |
83 | kommer – 2226 |
84 | to – 2224 |
85 | bliver – 2094 |
86 | få – 2022 |
87 | må – 2022 |
88 | mere – 1998 |
89 | tilbage – 1971 |
90 | igen – 1960 |
91 | nok – 1907 |
92 | mor – 1904 |
93 | været – 1873 |
94 | måske – 1846 |
95 | sammen – 1840 |
96 | helt – 1819 |
97 | os – 1803 |
98 | deres – 1796 |
99 | ser – 1789 |
100 | sådan – 1780 |
101 | alt – 1761 |
102 | gik – 1742 |
103 | end – 1698 |
104 | mand – 1642 |
105 | gang – 1638 |
106 | hele – 1626 |
107 | fik – 1617 |
108 | kun – 1592 |
109 | nogle – 1566 |
110 | lille – 1562 |
111 | ingen – 1514 |
112 | år – 1513 |
113 | under – 1510 |
114 | sit – 1505 |
115 | gå – 1491 |
116 | får – 1478 |
117 | stod – 1465 |
118 | uden – 1453 |
119 | ja – 1451 |
120 | siden – 1450 |
121 | før – 1444 |
122 | anden – 1432 |
123 | blive – 1406 |
124 | mange – 1406 |
125 | nogen – 1386 |
126 | andre – 1367 |
127 | mens – 1362 |
128 | gøre – 1356 |
129 | hen – 1349 |
130 | par – 1333 |
131 | dag – 1306 |
132 | sige – 1303 |
133 | komme – 1295 |
134 | tog – 1261 |
135 | frem – 1259 |
136 | gør – 1242 |
137 | tror – 1227 |
138 | sine – 1223 |
139 | hjem – 1207 |
140 | står – 1200 |
141 | aldrig – 1199 |
142 | samme – 1195 |
143 | ad – 1195 |
144 | hvordan – 1194 |
145 | denne – 1184 |
146 | tager – 1163 |
147 | tid – 1142 |
148 | andet – 1134 |
149 | tage – 1131 |
150 | store – 1127 |
151 | måtte – 1121 |
152 | hovedet – 1092 |
153 | blevet – 1082 |
154 | altid – 1061 |
155 | nej – 1026 |
156 | første – 1013 |
157 | hos – 1006 |
158 | din – 977 |
159 | rundt – 963 |
160 | flere – 959 |
161 | spurgte – 948 |
162 | vidste – 945 |
163 | vores – 943 |
164 | dette – 938 |
165 | mit – 923 |
166 | mellem – 901 |
167 | sidste – 899 |
168 | gjorde – 897 |
169 | fordi – 893 |
170 | sad – 893 |
171 | sidder – 888 |
172 | set – 876 |
173 | fået – 872 |
174 | lå – 859 |
175 | spørger – 857 |
176 | hvorfor – 855 |
177 | sted – 845 |
178 | stadig – 844 |
179 | ligger – 842 |
180 | gennem – 840 |
181 | først – 840 |
182 | mine – 839 |
183 | trak – 832 |
184 | gamle – 812 |
185 | bag – 802 |
186 | endnu – 797 |
187 | døren – 793 |
188 | hvem – 792 |
189 | væk – 790 |
190 | gerne – 789 |
191 | hver – 789 |
192 | vel – 788 |
193 | ude – 770 |
194 | hinanden – 767 |
195 | gange – 760 |
196 | inde – 756 |
197 | øjne – 751 |
198 | folk – 748 |
199 | hentet – 744 |
200 | tre – 743 |