• Универзитет у Београду Филолошки факултет | Катедра за општу лингвистику
Развојни корпус писаног српског језик

Процес компилације, структура и коришћење

Прикупљање грађе за корпус одвијало се увек по истој процедури и подразумевало увек исти след корака. У корпус су укључени текстови настали у природним, уобичајеним условима на које су деца навикла, значи, у школи, током часа. Радови су прикупљени од више од 3500 испитаника. Сваки ученик чији су писани радови укључени у корпус, радове је писао у два наврата, у размаку од 10 до 15 дана. Писање текстова у оба наврата трајало је по један школски час. Приликом сваке сесије ученик је добијао унапред припремљено писано упутство да напише један од четири типа текста – наративни, дескриптивни, експозиторни, или аргументативни. Ученици су сами давали наслов своме раду пошто су упутства за писање која су добијали била релативно уопштена и упућивала само на ширу тему, као и очекивани тип текста, али нису спецификовала прецизан наслов рада. Пошто свако дете пише два различита рада, која се сврставају у два различита типа текста, прикупљена грађа обезбеђује могућност поређења разлика које се у писаном језичком изразу јављају као последица варирања жанра, односно типа текста, као што омогућава и праћење развоја способности за писање текстова различитих жанрова.

Радови су прекуцани у формат Микрософт Word. Током прекуцавања верно су преношена сва обележја оригиналног текста – писмо којим је написан (укључујући и мешање алфабета, уколико га у раду има), правописне и интерпункцијске ознаке, графички облик текста (распоред и позиција наслова, позиција и распоред параграфа, и сл.). Верно су пренете и све грешке које се у раду јављају. У наредној фази обраде фајлови су из Word-формата пребачени у XML-формат.

Структура Развојног корпуса српског писаног језика

Део РАКОПС-а похрањен је у претраживу базу података са могућношћу преузимања језичких узорака/радова ученика у Word-формату, и то је место на коме се тренутно налазите. Сваки регистровани корисник може преузети ученичке радове из Ракопс-а. Регистрација је бесплатна. Пошто сте се регистровали, потребно је само да кликнете дугме Претрага корпуса, и дефинишете параметре за избор узорака које желите да преузмете обележавајући параметре на приказаним графицима, односно обележавањем кућица на крају странице. Критеријуми на основу којих можете да начините избор узорака за Ваше истраживање су следећи: (1) разред, (2) тип текста, (3) дијалекат, (4) величина насеља, (5) пол, (6) општи школски успех, (7) оцена из матерњег језика, и (8) упареност радова.