Eng
lish
Kontakt
Išči
Meni
Tečaji za odrasle
Izpiti
Knjige
Za otroke
Na tujih univerzah
Seminar SJLK
Simpozij obdobja
Izobraževanja za učitelje
34. Obdobja - 1. del:
Pojdi na
1 / 432
1
2-3
4-5
6-7
8-9
10-11
12-13
14-15
16-17
18-19
20-21
22-23
24-25
26-27
28-29
30-31
32-33
34-35
36-37
38-39
40-41
42-43
44-45
46-47
48-49
50-51
52-53
54-55
56-57
58-59
60-61
62-63
64-65
66-67
68-69
70-71
72-73
74-75
76-77
78-79
80-81
82-83
84-85
86-87
88-89
90-91
92-93
94-95
96-97
98-99
100-101
102-103
104-105
106-107
108-109
110-111
112-113
114-115
116-117
118-119
120-121
122-123
124-125
126-127
128-129
130-131
132-133
134-135
136-137
138-139
140-141
142-143
144-145
146-147
148-149
150-151
152-153
154-155
156-157
158-159
160-161
162-163
164-165
166-167
168-169
170-171
172-173
174-175
176-177
178-179
180-181
182-183
184-185
186-187
188-189
190-191
192-193
194-195
196-197
198-199
200-201
202-203
204-205
206-207
208-209
210-211
212-213
214-215
216-217
218-219
220-221
222-223
224-225
226-227
228-229
230-231
232-233
234-235
236-237
238-239
240-241
242-243
244-245
246-247
248-249
250-251
252-253
254-255
256-257
258-259
260-261
262-263
264-265
266-267
268-269
270-271
272-273
274-275
276-277
278-279
280-281
282-283
284-285
286-287
288-289
290-291
292-293
294-295
296-297
298-299
300-301
302-303
304-305
306-307
308-309
310-311
312-313
314-315
316-317
318-319
320-321
322-323
324-325
326-327
328-329
330-331
332-333
334-335
336-337
338-339
340-341
342-343
344-345
346-347
348-349
350-351
352-353
354-355
356-357
358-359
360-361
362-363
364-365
366-367
368-369
370-371
372-373
374-375
376-377
378-379
380-381
382-383
384-385
386-387
388-389
390-391
392-393
394-395
396-397
398-399
400-401
402-403
404-405
406-407
408-409
410-411
412-413
414-415
416-417
418-419
420-421
422-423
424-425
426-427
428-429
430-431
432
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
Simpozij OBDOBJA34 skupaj. Geselski ~lanki tako ne vsebujejo ve~besednih enot, kot so npr. frazemi ali termini, ravno tako pa nimajo pomenske lo~itve, razen ko imata dve gesli enako izto~nico, vendar je eno zastarelo, drugo pa ne. Posamezni geselski sestavek je namre~ enoli~no dolo~en kot njegova lema, njene oblikoskladenjske lastnosti in, za zastarele besede, razlaga v sodobni sloven{~ini. Geslo ima nato na{tete vse sodobne besedne oblike, ki se pojavijo med ro~no ozna~enimi besednimi pojavnicami v goo300k(-gaj) in foo3M(-gaj), te pa so nadrejene vsem zgodovinskim besednim oblikam iz korpusa. Besedje, izlu{~eno iz gaji~nega dela korpusa IMP, obsega 23.000 gesel. ^e izlo- ~imo slovarsko nezanimive pojavnice, kot so tuje, zatipkane in napa~no tokenizirane besede ter arabske in rimske {tevilke, dobimo 20.818 gesel, ob dodatni izlo~itvi lastnih imen pa 18.556. Mednjimije16%besedtak{nih,kisoozna~enekotzastarele. Pri skoraj dveh tretjinah zastarelih besed je bilo razlago za geselski ~lanek mogo~e ~rpati iz SSKJ (1.339 besed) oz. iz Pleter{nikovega slovarja (606 besed), za preostalih 1.008 pa je bilo treba razlago poiskati v drugih slovarskih virih oz. jo pri ve~ini (80,5 %) besed dolo~iti z analizo sobesedila. Razlage zastarelih besed so razmeroma kratke, v ve~ini primerov samo ena ali dve sodobni ustreznici oz. zelo kratka razlaga; pomembnojetudi, da so gesla vedno posamezne besede, zato so razlage samo delno ustrezne, ~e je geslo del stalne besedne zveze, na kar opozarja tudi Aha~i~ (2014). DazastarelihbesedizteskupineninevSSKJnevPleter{niku,jemogo~epripisati dejstvu, da je veliko besed terminolo{kih, iz strokovnih priro~nikov, nekaj pa je tudi tak{nih, ki so zna~ilne samo za dolo~en prevod (pri tuji literaturi) ali dolo~enega avtorja. 4 Zaklju~ek Vprispevku smo predstavili gaji~ni del korpusov in besedja starej{e sloven{~ine IMP, da bi dobili vpogled, kako bi lahko vsebovano besedje pripomoglo k bolj{i obvestilnosti spletnih slovarjev, ki vsebujejo tudi nekoliko starej{e besedje sloven- skega jezika. Analiza poka`e, da korpusi in besedje vsebujejo veliko besed, ki so se v~asih pisale druga~e ali pa so zastarele in so zato ve~ini sodobnih bralcev neznane. Tako je npr. v besedju IMP ve~ kot 1.300 gesel zastarelih besed, ki so `e zajete v SSKJ,zatobibiloslovar, vsaj za enoumne besede, razmeroma enostavno nadgraditi s povezavami v besedje oz. korpus (konkordan~nik). V nasprotju z veliko ve~ino slovarskih (pa tudi korpusnih) virov imajo korpusi in besedje IMP to prednost, da so prosto in odprto dostopni po licenci Creative Commons s priznanjem avtorstva, zato ni nikakr{nih lastni{kih ali pravnih ovir za tak{no povezovanje ali celo vklju~evanje. Vprihodnjemdelunameravamoodpravljatipreostalenapakevtrenutnihrazli~icah korpusov IMP(-gaj), hkrati pa pove~ati ro~no ozna~ene dele korpusa, predvsem za - besedila 1900–1918, ki {e niso ro~no pregledana. Na tehni~ni ravni se bomo osre doto~ili na izbolj{anje metod za posodabljanje besed ter se lotili vpra{anj besedotvorja in skladnje starej{ih slovenskih besedil. 207