Databáze jazykových chyb v češtině mluvčích s prvním jazykem slovanským je dvouletý grantový projekt realizovaný na FF UK v Praze za finanční podpory Grantové agentury UK, č. p. 286411. Jedná se o chybový korpus ruských, ukrajinských a polských studentů češtiny s pracovním názvem CHRUP (Chyby Rusů Ukrajinců a Poláků).
Na vzniku databáze se podílel řešitelský kolektiv v tomto složení:
Prof. Ph.Dr. Hana Gladkova, CSc.- odborné vedení a záštita projektu.
Mgr. Katsiaryna Ramasheuskaya - hlavní řešitelka projektu, zajištění ruské části projektu.
Mgr. Svitlana Izmaylova - spoluřešitelka, zajištění ruské části projektu.
Mgr. Jana Macurová - spoluřešitelka, zajištění ukrajinské části projektu.
Mgr. Katarzyna Vaculová (roz. Bołbot)- spoluřešitelka, zajištění polské části projektu.
Mgr. George Zhygalko - technické zajištění projektu.
Primárním motivem pro tvorbu tohoto chybového korpusu byl zřetel didaktický. Snažili jsme se zohlednit skutečné potřeby učitelů a poskytnout jim utříděný materiál pro vyučovací účely. Žákovská chyba je pro učitele signálem toho, co by mělo být lépe objasněno a prohloubeno v teorii a praxi. Rozbor a analýza chyb dává možnost konkrétněji určit obtíže při osvojování studenty cizího jazyka a zároveň stanovit stupeň a dynamiku obtížnosti sledovaného jevu. Rozhodnutí zaměřit se na chyby zejména ruských, ukrajinských a polských studentů vycházelo hned z několika důvodů. Prvním byly bezpochyby oficiální statistiky o počtech cizinců pobývajících na území ČR (Dostupné z WWW:
http://www.czso.cz/csu/cizinci.nsf/kapitola/ciz_pocet_cizincu).
Dalším důvodem pro volbu zkoumaného vzorku byl slovanský základ, tzn. výchozí východoslovanský a západoslovanský jazyk. Zajímalo nás, jakým obtížím budou čelit žáci, jejichž mateřský jazyk je blízký češtině. S ohledem na jazykovou příbuznost se jedná o skupinu velmi výjimečnou z hlediska výuky češtiny jako cizího jazyka.
Databáze zahrnuje písemné práce respondentů na všech úrovních znalosti, podmínkou ovšem byla schopnost studenta napsat krátkou esej v českém jazyce. Sběr jazykových dat probíhal zejména na pracovištích zajišťujících výuku češtiny jako cizího jazyka v ČR, konkrétně na ÚBS FF UK v Praze, na ÚJOP UK ve střediscích Albertov, Krystal a Poděbrady, a v zahraničí na Varšavské, Vratislavské, Jagellonské univerzitách a na Technicko-humanistické akademii v Bílsku-Bělé. Písemné práce od ukrajinských mluvčích jsme získali mimo jiné díky spolupráci s Oblastní řeckokatolickou charitou v Českých Budějovicích. Aby studenti při plnění úkolů nemuseli používat slovníky a jiné učební pomůcky, se tyto písemné projevytematicky zaměřily na otázky každodenního života. Vliv textových editorů nabízejících automatickou opravu chyb jsme se snažili minimalizovat omezením na ručně psané texty. Do databanky nebyly přijímány eseje obsahující citace, parafráze a odbornou terminologii. Spolu s texty studenti dodávali
vyplněny dotazník poskytující základní informace, které mohou být relevantní z hlediska osvojování si češtiny. Jde konkrétně o věk, pohlaví, rodný jazyk (respondentův, rodičů, partnerů), způsob výuky a její motivace, délka pobytu v České republice atd.
Sebraný materiál byl převeden do elektronické podoby a byl označkován podle speciálně vytvořené chybové taxonomie. Tato taxonomie vznikla na základě pilotního zpracování 15 respondentů z každého jazyka a byla zpřesňována po celou dobu značkování materiálu. V současné době (stav k 24.3.2013) databáze zahrnuje práce 185 respondentů (54 polských mluvčích, 74 ukrajinských a 57 ruských) s rozsahem 258895 znaků (což odpovídá 144 normostranám), konkrétně 97 polských textů (počet znaků 93584, 52 normostran) , 96 ukrajinských textů (p. z. 89137, 50 nrmostran) a 87 ruských textů (p. z. 76174, 42 normostran).
Vyhledávání v databázi je umožněno na základě dvou základních kritérií. V první řadě jde o hledání prostřednictvím pěti chybových kategorií, tj. písmo a pravopis, morfologie, syntax, lexikum a stylistika, členěných dále na podkategorie. Uživatel také může filtrovat chyby na základě informací o mluvčích, které byly poskytnuty prostřednictvím již zmiňovaného dotazníku, tj. podle mateřského jazyka nebo věku mluvčích, délky výuky českého jazyka atp. Software dovoluje označení více kategorií zároveň, popř. spojení obou kritérií vyhledávání. Lepší orientaci ve výsledcích zajišťuje barevné rozlišení jednotlivých druhů chyb a základní statistiky. Podrobné pokyny pro práci s databázi naleznete v Manuálu (ke stažení zde). Doufáme, že předkládaný korpus se stane využívanou pomůckou nejen pro učitele češtiny jako cizího jazyka, lingvisty, vědecké pracovníky a studenty, kteří se zabývají jazykovým kontaktem a potřebují spolehlivý zdroj jazykového materiálu pro studium např. mezijazyka, inteference
aj., ale i pro cizince, kteří se česky teprve učí.