Současná lingvistika

 
Současná lingvistika
Tzv. pomezní disciplíny
Empirické metody
 
 
Psycholingvistika 
Sociolingvistika
Etnolingvistika
Neurolingvistika
Biolingvistika
Kvantitativní lingvistika
 
 
Psycholingvistika
produkce řeči (psychické mechanismy, které umožňují mluvčímu nebo pisateli tvořit výpovědi v přirozeném jazyce)
porozumění řeči (mechanismy, které umožňují posluchači n. čtenáři výpovědím rozumět), vztahy mezi osvojováním jazyka dítětem a dětská řeč
osvojování druhého jazyka
bilingvismus (diglosie)
 
 
Osvojování druhého jazyka
osvojování druhého jazyka (second language acquisition / L2 acquisition)mluvčí se nachází v zemi, kde se tento jazyk užívá v běžné komunikaci 
osvojování cizího jazyka (foreign language acquisition)mluvčí se učí ve své vlasti v rámci jazykové výuky
Toto rozlišení souvisí s rozlišováním dvou typů osvojování nemateřského jazyka: 
řízené osvojování s instrukcemi (tzv. tutored acquisition)
neřízené osvojování v přirozeném kontextu bez instrukcí (tzv. untutored acquisition).
 
 
Osvojování druhého jazyka
Jedna z ústředních otázek ve výzkumu je, zda a z jakých důvodů se osvojování nemateřského jazyka odlišuje od nabývání mateřského (prvního) jazyka.
Hypotéza tzv. kritického období vztahující se k věku mluvčích. 
Podle např. Lenneberga je úplné či perfektní osvojení jazyka po pubertě nemožné. 
Výsledky výzkumu jsou velmi sporné, důležitou roli hrají tzv. afektivní (psychosociální) faktory, např. motivace mluvčího, schopnost/připravenost se identifikovat s druhým jazykem, resp. s cizí kulturou.
 
 
Osvojování druhého jazyka
Faktory ovlivňujících osvojování druhého jazyka
impuls k učení nemateřského jaz. spojený s motivací, potřebou sociální integrace a s komunikačními potřebami mluvčího; 
všeobecná schopnost si (druhý) jaz. osvojit, vztahující se k všeobecným kognitivním (např. paměť) a biologickým (např. dobrý sluch); 
přístup k danému jazyku, možnost v daném jazyku komunikovat; 
struktura jazyka, zejm. pak rozdíly a podobnosti jazykové struktury mezi výchozím (mateřským) jaz. a osvojovaným (cílovým) jaz.; 
 
 
CZ psycholingvistika
Psychologický ústav AV http://www.psu.cas.cz/lab/
Laboratoř behaviorálních a lingvistických studií AV & UK http://labels.ff.cuni.cz/
Vývojová psycholingvistika (osvojování mateřského jazyka u dětí)
Filip Smolík
 
Sociolingvistika
Zkoumá vztahy jazyka a společnosti. 
Cílem je zjistit kauzální vztahy mezi jazykem a společností (v obou směrech).
Formovala od 60. let 20. stol.
Diglosie, bilingvismus, sociolekty, teorie spisovného jazyka.
 
 
Variační sociolingvistika
Spjata především s dílem amerického badatele Wiliama Labova. Představuje směr, který bývá nejčastěji ztotožňován se sociolingvistikou jako takovou. 
Korelační (kauzální) přístup.
Nezávislé proměnné: sociální aspekty: třída, pohlaví, věk, etnicita,…
Závislé proměnné: hlásky, tvary, … (varianty)
 
 
Wiliam Labov
Považován za zakladatele sociolingvistiky
Proslavil se výzkumem stratifikace r-ových variant u zaměstnanců obchodů s různou cenovou a prestižní úrovní. 
Užití r bylo přitom sledováno hned ve dvou stylech: v normální odpovědi na otázku, kde se prodává obuv (fourth floor!), a v pečlivém zdůraznění, když explorátor předstíral, že první odpovědi nerozuměl. Celá akce získání dat od 264 osob i se zaznamenáním základních nezávisle proměnných (pohlaví, věk, rasa ap.) trvala jen 61/2 hodiny. 
Výsledné grafy ukazují zřetelně progresívní zastoupení vyslovovaného r podle stoupající prestiže obchodů.
 
 
Sociologie jazyka
Také dominuje korelační přístup, ale její záběr je obecnější
Nepracuje se s prvky struktury jazyka, ale spíš s komplexními útvary a procesy jako varieta a standardizace (kodifikace).
Společenské struktury: jazykové společenství a komunikační doména (rodina, škola, úřad apod.). 
Např. pomocí rozsáhlého dotazníkového průzkumu zjistit, jaká varieta se používá v určitých komunikačních doménách, jaké jsou postoje k této varietě => výběr variety pro funkci standardního (spisovného) jazyka. 
 
 
Interakční (interpretativní) sociolingvistika
Vychází z konverzační analýzy a filozofie jazyka 
Analyzují se interpretační procesy účastníků rozhovoru – to, jak mluvčí interpretují jazyková jednání svých komunikačních partnerů a jak svá jazyková jednání činí interpretovatelnými.
Konverzační analýza zkoumá metody a prostředky mluvčích při produkci a interpretaci různých aspektů přirozeně se vyskytujících rozhovorů.
Blízko k pragmatické lingvistice.
 
 
Etnolingvistika
Lingvistický přístup zkoumající vztahy mezi jazykem a kulturou. 
Jak se v sémantických strukturách jaz. projevuje specifická kulturní a historická zkušenost a na ni vázané hodnoty určitého společenství, jeho jazykový obraz světa.
Hypotéza Sapira a Whorfa (teorie jazykového relativismu): jazyk má zásadní vliv na chápání světa => kolik existuje jazyků, tolik máme i různých světů.
Vznikla ve 30. letech 20. stol. v USA studiem indiánských kmenů.
 
 
Jazykový obraz světa
Interpretace světa fixovaná v jazyce.
Specifické pojetí reality v myšlení daného společenství, které lze vyčíst z jeho jazyka a textů vzniklých (a vznikajících) na jeho základě. 
Je často v rozporu se skutečností (slunce vychází a zapadá bez ohledu na zákonitosti vesmírných pohybů) a je kulturně podmíněn.
Např. množství názvů pro rýži v asijských jaz., detailní strukturace času a jeho měření v evropských jaz. (oproti např. jaz. africkým), mezijazyková rozdílnost v pojetí barev, emocí, prostorových pojmů apod. 
 
 
CZ sociolingvistika
Jan Chromý (FF UK)
Lucie Radková (FF OU)
 
 
Neurolingvistika
Zabývá se primárně afáziemi.
Afázie = porucha řeči způsobená poškozením části mozku.
Řečová centra = části mozku zodpovědné za konkrétní řečové schopnosti.
Pierre Paul Broca (1861) přišel s prvním přesvědčivým důkazem, že konkrétní mozkové oblasti se kriticky podílejí na produkci řeči.
Dnes počítačová tomografie, magnetická rezonance, …
 
 
Brocova afázie (BA) 
Poškození levé hemisféry v Brocově oblasti (dolní čelní závit). 
Zjednodušená syntax: redukovaná délka výpovědi, tj. neukončené výpovědi.
Substituce verba jmenným výrazem (pes štěkání, zedník stavení cihla).
U BA rozdíl mezi jaz. znalostmi (langue) a jejich užíváním (parole). Pacienti s BA mají redukovanou schopnost aplikace gramatických pravidel, nicméně jejich gramatické znalosti bývají zachovány.
 
 
Wernickeova afázie (WA)
Poškození Wernickeova centra (zadní část horního spánkového závitu v levé hemisféře). 
Plynulá řečová produkce obsahuje zcela neznámé výrazy, tj. pseudoslova (neologismy).
„jenom tady je to jako špalý, asi něco slý, co to je tuhle uče pemito, jenom si jako cizuny čuky, celý cezi, mičeři ten jeden…“
 
 
Biolingvistika
Zkoumá komunikaci v živých systémech.
Akustické, vizuální, chemické a jiné znaky používané lidmi jsou používány nejenom lidmi. 
Poznatky z lidské komunikace lze využít i v komunikaci zvířat a dalších organismů.
Zpracování znaků funguje podobným způsobem, jakým to činí lidský mozek 
Biologie je studovaná jako znakový systém, kde interpretace znaků probíhá mnoha různými způsoby a je přihlíženo k subjektivní roli interpreta.
 
 
CZ biolingvistika
Anton Markoš (PřF UK)
Dan Faltýnek, Vladimír Matlach (FF UP)
Biosémiotika,analýza DNA
 
 
Kvantitativní (matematická) lingvistika
Matematická lingvistika
Počítačová (komputační) lingvistika
Kvantitativní lingvistika
Formální lingvistika
Algebraická lingvistika
Korpusová lingvistika
Lexikální statistika
Stylometrie
NLP
Neuronové sítě
 
Proč kvantitativní?
Objektivnost (při opakovaném měření vždy stejné výsledky).
Rychlost (počítačové zpracování dat).
Možnost pracovat s velkým množstvím dat
Jednoduchost.
 
 
Nevýhody kvantitativních metod
Zjednodušování zkoumaných jevů.
Limity strojového zpracování dat.
Nekomplexní pohled.
 
 
„The conventional university education in linguistics does not stimulate a linguist to deal with language in any way other than the orthodox one. There are unwritten norms for the extent of knowledge, some things are important, and some others will not even be taken into consideration.” (Gabriel Altmann)
 
 
„Či už používame verbálne alebo matematické modely, všetko je v nich zjednodušené. Každý model zachytáva len isté aspekty javu, a aj tie musí relatívne izolovať, t. j. musí ignorovať mnohé jeho vnútorné i vonkajšie vzťahy, ktoré sú zvyčajne implicitne obsiahnuté ceteris paribus. Nie je jasné, ako by sa dala komplexita objektov zachytiť presnejšie alebo detailnejšie prirodzeným jazykom, ktorý je sám plný vágnosti, nepresnosti, mnohoznačnosti atď. Nazhromaždenie opisných údajov je len predpokladom pre analýzu, nie samotná analýza. Kvantifikácia a matematizácia nie sú teda ničím iným než spresnením a prehĺbením výskumu exaktnejšími metódami, ktoré umožňujú dedukciu a výstavbu teórie.“ (Gejza Wimmer)
 
 
CZ QL
Od začátku 20. stol. 
Nejprve hlavně těsnopis a pedagogika.
Pražská strukturalistická škola
Vilém Mathesius, Bohumil Trnka, Josef Vachek, …
Frekvenční slovník (Jelínek, Bečka, Těšitelová), 1961, 16 mil slov.
MČ (4) Kvantitativní charakteristiky současné češtiny, 1985
Jan Králík, Pravděpodobnostní modely v kvantitativní lingvistice  první CZ QL Ph.D. (1994)
Luděk Hřebíček (větný agregát)
Ludmila Uhlířová (syntax, typologie)
Radek Čech http://www.cechradek.cz/
Jiří Milička http://www.milicka.cz/
Jan Andres
Martina Benešová
 
 
Jazykové korpusy
Co je jazykový korpus?
Databáze textů pro lingvistické účely.
Texty jsou zpravidla anotovány.
Velké korpusy mají speciální nástroje pro vyhledávání.
Největším českým korpusem je Český národní korpus (ČNK)
 
 
Český národní korpus (ČNK)
Projekt založený v roce 1994 při FF UK a spravovaný Ústavem Českého národního korpusu. 
Cílem je systematicky mapovat češtinu a další jazyky ve srovnání s ní. 
ČNK má přes 3,5 mil. slov.
Data jsou zdarma dostupná po registraci na http://korpus.cz/
 
 
Korpusy ČNK
Korpusy psané současné češtiny (řada SYN).
Specializované korpusy současné češtiny (CzeSL, KSK-dopisy, LINK, orwell, Skript2012).
Mluvené synchronní korpusy (ORAL2013, ORAL2008, ORAL2006, BMK, PMK, SCHOLA2010).
Diachronní psané korpusy (DIAKORP)
Cizojazyčné korpusy (DOTKO, HOTKO)
Paralelní (InterCorp)
 
 
Korpusy
Reprezentativní (referenční) × nereprezentativní (specializované)
Referenční × Nereferenční (verzované)
Synchronní × diachronní 
Lemmatizované × nelemmatizované
Morfologicky nebo syntakticky označkované (tagované).
 
Nástroje ČNK – KonText
Základní vyhledávací nástroj ČNK.
Pracuje s konkordancemi.
Dostupný na kontext.korpus.cz
 
 
Nástroje ČNK – SyD
Aplikace SyD (Synchronní a Diachronní analýza variant) 
Slouží především k průzkumu vzájemně si konkurujících jazykových jevů. 
Dostupná bez registrace na adrese syd.korpus.cz
 
 
Nástroje ČNK – Morfio
Aplikace Morfio slouží k odhadování rozsahu a produktivity slovotvorných modelů v češtině.
Využitelná zejména pro slovotvorný výzkum, zejména v oblasti derivace (odvozování).
Dostupné bez registrace na adrese morfio.korpus.cz
 
 
Nástroje ČNK – KWords
Identifikovat tzv. klíčových slov (keywords), což jsou slovní tvary, která se ve zkoumaném textu objevují významně častěji než v referenčním korpusu.
Dostupné bez registrace na kwords.korpus.cz
 
 
Nástroje ČNK – Treq
Aplikace Treq slouží k prohledávání česko-cizojazyčných slovníků na základě dat paralelního korpusu InterCorp. 
Vyhledání překladových ekvivalentů či hledání synonym.
Dostupné bez registrace na treq.korpus.cz
 
 
Korpus DIALOG (UJČ & ÚFAL)
Multimediální korpus mluvené češtiny. 
Nahrávky a přepisy diskusních pořadů ČT. 
Dostupné po registraci na http://ujc.dialogy.cz/
 
 
Pražský závislostní korpus (PDT)
 
 
Textová lingvistika
Teorie textu vznikla v 70. – 80. letech, zabývá se obecnými mechanismy utváření textu jako celku.
Základní jednotkou lingvistiky je text.
Člověk nekomunikuje v jednotlivých slovech nebo větách, ale vždy v textech.
V lingvistice lze pozorovat tendenci od nižších jednotek k vyšším.
 
Teorie textu zkoumá
Co je text
Jak a čím je konstituován
Čím se liší od náhodně seskupených vět
Hranice textu
Jak autor text vytváří a jak jej přijímá adresát
TEXT je:
Z propozičního hlediska koherentní zřetězení vět.
Z komunikačního hlediska komunikát, musí splňovat kom. podmínky srozumitelnosti.
 
 
Typologie textu
Snaha vytvořit nějakou typologii textu souvisí s otázkou vztahu langue a parole k textu. Řeší se, zda je možné vytvořit textové vzorce. 
 
Horizontální členění textu
Lineární členění textu: část úvodní, střední a závěrečná, kapitoly, odstavce, titulky, předmluvy, shrnutí, doslovy atd.
 
Vertikální členění textu
Způsoby vyjádření odrážející hierarchii jednotlivých informací a jejich vzájemné vztahy, které se děje na celé ploše textu a může ji i přesahovat díky intertextovosti. 
Odlišuje základní a vedlejší sdělení.
Např. poznámky, citace, odkazy na literaturu, grafy, obrázky.
 
Textová koherence (spojitost textu)
Spojitost na úrovni hloubkové struktury. Je širším pojmem než koheze. Je podmíněna logickou souvislostí mimojazykových skutečností.
Od každého textu očekáváme, že je koherentní a že by měl pro nás vykazovat smysluplnou souvislost. 
Když koherence (na výrazové rovině) není jednoznačná a explicitní, tak se snažíme na základě mimojazykových zkušeností koherenci odhalit, a to i na základě složitějších postupů jako třeba asociace.
Koherence a koheze
Koherence: jednota obsahu, tematická návaznost, obsahová souvislost.
Koheze: jednota na úrovni jazykového vyjádření (deiktická zájmena, opakování slov, synonyma, parafráze, odkaz na předchozí část textu apod.).
 
Tematické posloupnosti
Téma (někdy také východisko výpovědi, zapojená část, základ nebo známá informace) je jedna ze dvou komplementárních složek Mathesiovy teorie aktuálního členění větného (AČV). Podle teorie AČV je téma (T) to, o čem se mluví, a réma (R) to, co se o tématu říká. 
Téma (východisko, topic)
Réma (jádro, ohnisko, focus)
 
Návazná tematizace rématu
Národní muzeum stojí na Václavském náměstí. Toto náměstí je jedním z nejrušnějších míst Prahy. Praha má více než milion obyvatel.
 
TP s průběžným tématem
Národní muzeum stojí na Václavském náměstí. Je to velmi památná budova. Bylo založeno již v roce 1818.
 
Derivace z hypertématu
Národní muzeum stojí na Václavském náměstí. Jiná mimořádně významná pražská budova, Národní divadlo, je umístněná na Smetanově nábřeží.
 
Rozvíjení rozštěpeného rématu
Výroky mohou být pravdivé, nebo nepravdivé. Je-li výrok pravdivý, říkáme, že jeho pravdivostní hodnota je „pravdivost“. Je-li nepravdivý, pak je jeho pravdivostní hodnota „nepravdivost“.