Empirický výzkum

 
Empirický výzkum v jazykovědě
EVJA 01
 
Co je empirie?
Zkušenost získaná pozorováním, případně pokusem (experimentem).
 
Empirismus
Filozofický směr a převládající přístup ve většině vědních oborů.
 
Francis Bacon (1561–1626)
Zakladatel novověkého empirismu.
Nové organon (odkaz na Organon Aristotela).
Bacon nabízí vědcům novou metodu – indukci.
Od konkrétních pozorování k obecným závěrům.
Důraz na experiment.
Kritizuje dosavadní vědu založenou na dedukci.
 
John Locke (1632–1704)
Hlavní představitel novověkého empirismu.
Stojí v opozici v racionalismu.
Popírá předem dané ideje.
Člověk se rodí jako nepopsaná deska (tabula rasa), jež se formuje na základě zkušeností.
„Nic není v rozumu, co nebylo dříve ve smyslech.“
 
George Berkeley (1685–1753)
Kritika empirismu, resp. jeho redukce > krajní empirismus.
Smysly nás klamou. 
Jak tedy můžeme objektivně poznat svět?
Teoreticky teprve naše vnímání uděluje věcem existenci.
 
Karl Popper (1902–1994)
Popper kritizoval teorii verifikace novopozitivistů Vídeňského kruhu. 
Podle logického positivismu se vědecké hypotézy získávají indukcí. 
Žádný počet pokusných potvrzení nemůže vědeckou teorii definitivně dokázat. Na rozdíl od verifikace, která je vždy jen částečná, pouze falzifikace může být definitivní.
Základem vědeckého poznání není verifikace (potvrzení), ale falsifikace. 
Pouze ta teorie, kterou je možné podrobit falsifikaci, tedy vystavit ji možnosti vyvrácení, je vědecká.
Konečnou, definitivní jistotu naší přesné znalosti pravdy nemůžeme mít nikdy, k pravdě se můžeme pouze přibližovat neustálým vylučováním falsifikovaných teorií, hovoříme o evoluci vědy. 
 
Thomas Samuel Kuhn (1922–1996) 
Struktura vědeckých revolucí > střídání paradigmat
Vědecké poznání nesměřuje k nějaké jediné pravdě o světě, netýká se žádné „objektivní reality“
Věda má svůj kulturní, dějinný, instituční, sociální a psychologický rozměr. 
Kuhn kritizuje Popperův "naivní falsifikacionismus", který se soustředil na období krize paradigmatu, kdy empirické výsledky zpochybňují platné paradigma, a přehlíží období jeho vzniku, kdy empirická potvrzení naopak paradigma postupně budují a „verifikují“.
Interpretace experimentu, který podle Poppera přijatou teorii vyvrací, je sama také falzifikovatelná, takže vyvracení teorie je ve skutečnosti složitý proces postupného převažování a budování nového „paradigmatu
 
Racionalismus
Důraz na rozumovou složku poznání.
Dedukce = od obecného k jednotlivému.
Smysly nás klamou. barva
René Descartes: „Cogito, ergo sum“ (Myslím, tedy jsem).
Poznání je možné jen díky apriorním předpokladům, které nelze odvodit ze smyslové zkušenosti.
Matematika, logika.
 
Indukce vs. dedukce
 
Dedukce
"Všichni lidé jsou smrtelní." (první premisa)
"Sókratés je člověk." (druhá premisa)
"Takže Sókratés je smrtelný." (dokázaný závěr)
 
Indukce
"Sókratés je smrtelný." (první premisa)
"Sókratés je člověk." (druhá premisa)
"Všichni lidé jsou smrtelní." (hypotéza o obecném)
 
Empirická věda
Založena na experimentech a ověřitelných hypotézách.
Indukce (generalizace)
Úplná (pracujeme s populací)
Neúplná (pracujeme s výběrovým souborem)
 
 
Matematická lingvistika
Matematická lingvistika
Počítačová (komputační) lingvistika
Kvantitativní lingvistika
Formální lingvistika
Algebraická lingvistika
Korpusová lingvistika
Lexikální statistika
Stylometrie
NLP
Deep learning > neuronové sítě
 
Matematická lingvistika
"Vědní obor, který stojí na pomezí lingvistiky, matematiky a informatiky včetně jejího odvětví zvaného umělá inteligence; lze ji členit na ↗komputační lingvistiku (počítačovou lingvistiku), ↗formální lingvistiku a ↗kvantitativní lingvistiku (statistickou lingvistiku)."
Vladimír Petkevič  (NESČ)
 
QL časopisy
http://quantitativelinguistics.webnode.com/journals/
 
„The conventional university education in linguistics does not stimulate a linguist to deal with language in any way other than the orthodox one. There are unwritten norms for the extent of knowledge, some things are important, and some others will not even be taken into consideration.”
Gabriel Altmann
 
„Či už používame verbálne alebo matematické modely, všetko je v nich zjednodušené. Každý model zachytáva len isté aspekty javu, a aj tie musí relatívne izolovať, t. j. musí ignorovať mnohé jeho vnútorné i vonkajšie vzťahy, ktoré sú zvyčajne implicitne obsiahnuté ceteris paribus. Nie je jasné, ako by sa dala komplexita objektov zachytiť presnejšie alebo detailnejšie prirodzeným jazykom, ktorý je sám plný vágnosti, nepresnosti, mnohoznačnosti atď. Nazhromaždenie opisných údajov je len predpokladom pre analýzu, nie samotná analýza. Kvantifikácia a matematizácia nie sú teda ničím iným než spresnením a prehĺbením výskumu exaktnejšími metódami, ktoré umožňujú dedukciu a výstavbu teórie.“
Gejza Wimmer
 
CZ QL
Od začátku 20. stol. 
Nejprve hlavně těsnopis a pedagogika.
Pražská strukturalistická škola
Vilém Marhesius, Bohumil Trnka, Josef Vachek, …
Frekvenční slovník (Jelínek, Bečka, Těšitelová), 1961, 16 mil slov.
MČ (4) Kvantitativní charakteristiky současné češtiny, 1985
Jan Králík, Pravděpodobnostní modely v kvantitativní lingvistice  první CZ QL Ph.D. (1994)
Luděk Hřebíček (větný agregát)
Ludmila Uhlířová (syntax, typologie)
Radek Čech http://www.cechradek.cz/
Jiří Milička http://www.milicka.cz/
Jan Andres
Martina Benešová
 
Významná CZ pracoviště
ÚFAL UK https://ufal.mff.cuni.cz/
Fonetický ústav UK http://fonetika.ff.cuni.cz/
ČNK UK  http://korpus.cz/
Psychologický ústav AV http://www.psu.cas.cz/lab/
Laboratoř behaviorálních a lingvistických studií AV & UK http://labels.ff.cuni.cz/
Versologie AV http://versologie.cz/
Centrum zpracování přirozeného jazyka https://nlp.fi.muni.cz/
Katedra obecné lingvistiky UP http://oltk.upol.cz/
Institute for Research and Applications of Fuzzy Modeling http://irafm.osu.cz/
 
A15: Tvrdá data v měkkých vědách - Lukáš Zámečník
https://www.youtube.com/watch?v=ouL7Kwnceqo