Eng
lish
Kontakt
Išči
Meni
Tečaji za odrasle
Izpiti
Knjige
Za otroke
Na tujih univerzah
Seminar SJLK
Simpozij obdobja
Izobraževanja za učitelje
32. Obdobja:
Pojdi na
1
2-3
4-5
6-7
8-9
10-11
12-13
14-15
16-17
18-19
20-21
22-23
24-25
26-27
28-29
30-31
32-33
34-35
36-37
38-39
40-41
42-43
44-45
46-47
48-49
50-51
52-53
54-55
56-57
58-59
60-61
62-63
64-65
66-67
68-69
70-71
72-73
74-75
76-77
78-79
80-81
82-83
84-85
86-87
88-89
90-91
92-93
94-95
96-97
98-99
100-101
102-103
104-105
106-107
108-109
110-111
112-113
114-115
116-117
118-119
120-121
122-123
124-125
126-127
128-129
130-131
132-133
134-135
136-137
138-139
140-141
142-143
144-145
146-147
148-149
150-151
152-153
154-155
156-157
158-159
160-161
162-163
164-165
166-167
168-169
170-171
172-173
174-175
176-177
178-179
180-181
182-183
184-185
186-187
188-189
190-191
192-193
194-195
196-197
198-199
200-201
202-203
204-205
206-207
208-209
210-211
212-213
214-215
216-217
218-219
220-221
222-223
224-225
226-227
228-229
230-231
232-233
234-235
236-237
238-239
240-241
242-243
244-245
246-247
248-249
250-251
252-253
254-255
256-257
258-259
260-261
262-263
264-265
266-267
268-269
270-271
272-273
274-275
276-277
278-279
280-281
282-283
284-285
286-287
288-289
290-291
292-293
294-295
296-297
298-299
300-301
302-303
304-305
306-307
308-309
310-311
312-313
314-315
316-317
318-319
320-321
322-323
324-325
326-327
328-329
330-331
332-333
334-335
336-337
338-339
340-341
342-343
344-345
346-347
348-349
350-351
352-353
354-355
356-357
358-359
360-361
362-363
364-365
366-367
368-369
370-371
372-373
374-375
376-377
378-379
380-381
382-383
384-385
386-387
388-389
390-391
392-393
394-395
396-397
398-399
400-401
402-403
404-405
406-407
408-409
410-411
412-413
414-415
416-417
418-419
420-421
422-423
424-425
426-427
428-429
430-431
432-433
434-435
436-437
438-439
440-441
442-443
444-445
446-447
448-449
450-451
452-453
454-455
456-457
458-459
460-461
462-463
464-465
466-467
468-469
470-471
472-473
474-475
476-477
478-479
480-481
482-483
484-485
486-487
488-489
490-491
492-493
494-495
496-497
498-499
500-501
502-503
504-505
506-507
508-509
510-511
512-513
514-515
Simpozij OBDOBJA32 precej okraj{av (npr. rd, ln, nm), med katerimirabnik prese`e maksimalno {tevilo dovolje- so nekatere sestavljene tudi iz {tevil~no-nih znakov 140 in tvit skraj{a z brisanjem ~rkovnih kombinacij (npr. mi2, 5ra, 3p),nekaterih presledkov v sporo~ilu, najve~krat druge pa so prevzete iz angle{~ine (npr. lol,za sicer nesti~nimi lo~ili, v~asih pa tudi med wth, imho). [tevilne okraj{ave so specifi~nebesedami, kar lahko ote`i razumevanje spo- za Twitter (npr. RT, MT, FF, DM) oz. navajajoro~ila, mo~no pa je prizadeto tudi avtomatsko druga popularna dru`bena omre`ja (npr. fb,procesiranje tvitov. Zaradi okoli{~in, v kate- fsq, flickr, tumblr). rih tviti nastajajo, so v njih pogoste tipkarske Zelo pogosto je pisanje skupaj, kar se vnapake, ki prav tako negativno vplivajo na skladu s pravopisom pi{e narazen, predvsemozna~evanje korpusa, in nestandardna raba prislov ne pred osebno glagolsko obliko (npr.malih in velikih za~etnic, kar ote`uje pred- nemor{, nebo{, neve{, nav{, naujo) in ~len tavsemavtomatsko ozna~evanje lastnih imen. pred posamostaljenim pridevnikom (npr. ta- najla`ji, tamalim, unadva), kar ote`uje toke-3.3 Leksikalne zna~ilnosti nizacijo, posledi~no pa tudi avtomatsko obli-Za analizo leksikalnih zna~ilnosti sloven- koskladenjsko ozna~evanje in lematizacijo zskih tvitov smo izdelani korpus primerjali s modeli standardne sloven{~ine. Pisanje sku-korpusom ccKRES. Za primerjavo smo upo- paj je v tvitih pogosto tudi takrat, kadar upo-rabilimetodofrekven~negaprofila Tabela 1: Prvih 20 lem s primerjalnega seznama korpusa Tweet-sl s ccKRES glede na LL; lema je specifi~na za tistega od korpusov, ki ima ve~jo {tevilko v svojem stolpcu (natisnjena krepko) Lema LL Tweet-sl.pmccKRES.pm Tweet-sl ccKRES d 61.274 6,6 0,15 33.121 1.533 in 35.662 13,38 28,44 67.216 284.460 pa 34.472 20,16 8,47 101.247 84.747 jaz 24.154 12,14 4,68 60.978 46.826 ki 23.344 3,18 9,98 15.959 99.813 ja 22.761 3,31 0,28 16.603 2.763 p 21.672 2,49 0,09 12.499 868 ne 17.611 14,19 6,95 71.238 69.470 {e 17.360 10,06 4,21 50.542 42.105 iti 13.398 4,68 1,39 23.490 13.939 a 13.191 4,72 1,44 23.709 14.358 danes 11.636 2,69 0,53 13.513 5.253 xd 11.220 1,06 0 5.308 37 kaj 11.170 5,3 1,97 26.637 19.747 v 11.009 16,4 24,69 82.362 246.897 `e 10.316 6,18 2,63 31.036 26.311 ~e 10.190 6,62 2,94 33.263 29.399 jst 10.003 0,98 0,01 4.940 89 no 9.795 1,78 0,24 8.945 2.423 rt 9.769 0,94 0,01 4.741 63 sm 9.074 0,96 0,02 4.842 203 113