Detail předmětu

Biostatistika a zpracování dat

FCH-MC_BZDAk. rok: 2023/2024

Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací. 


Jazyk výuky

čeština

Počet kreditů

2

Vstupní znalosti

Dobrá znalost matematiky. Základní dovednosti práce v excelu. Schopnost základní analýzy a zpracování chemických a biologických dat.

 

Pravidla hodnocení a ukončení předmětu

1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10 bodech. Minimum pro úspěch: 5 bodů/úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu. 

2. Zápočet sestává z testu (max. 50 bodů, minimum pro úspěch je 25 bodů), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.

Finální hodnocení vychází z průměru hodnocení domácích úloh (váha 33,3 %), zápočtového testu (váha 33,3 %) a prezentace (váha 33,3 %). Klasifikovaný zápočet bude přidělen podle klasifikace ECTS.


1. V průběhu semestru budou studenti zpracovávat aplikované úlohy (prezenční forma ve cvičení, kombinovaná forma jako korespondenční úkoly). Jednotlivé úkoly budou bodově ohodnoceny. Celkem 5 úloh po 10-ti bodech. Minimum pro úspěch: 5 bodů / úloha. Dále musí studenti vypracovat dva domácí úkoly. Po splnění těchto úkolů se může student přihlásit k zápočtu.

2. Zápočet sestává z testu (minimum pro úspěch je polovina správných odpovědi), dále student dostane zadaný konkrétní výpočtový problém, který bude muset samostatně vyřešit pomocí statistických postupů. Podstatné výsledky poté student bude během zápočtu před ostatními studenti přítomnými na zápočtu a vyučujícím prezentovat. Pro úspěch je nutné najít správné řešení úkolu a odprezentovat postup a výsledky řešení.

 

 

Učební cíle

Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.

  

Absolvováním tohoto předmětu posluchači rozšíří své znalosti v oblasti pokročilého statistického zpracování experimentálních dat. Naučí se ovládat komplexní statistický software Statistica. Tyto nové znalosti a dovednosti jsou široce aplikovatelné v mnoha technických a přírodovědných oborech. Dalším benefitem je přímé propojení tohoto předmětu s realizací diplomových prací. Může tak přispět k vyšší kvalitě VŠKP realizovaných na FCH VUT.


Základní literatura

Meloun M., Militký J.: Statistická analýza experimentálních dat. Academia, Praha 2004. (CS)
Lepš J., Šmilauer P.: Biostatistika. Nakladatelství Jihočeské univerzity, České Budějovice, Česká republika, 2016. (EN)

Doporučená literatura

Meloun M.: Statistická analýza vícerozměrných dat v příkladech, Karolinium, Praha, Česká republika, 2017. (EN)
Meloun M.: Počítačová analýza vícerozměrných dat, Academia, Praha, Česká republika, 2005. (EN)

eLearning

Zařazení předmětu ve studijních plánech

  • Program NKCP_CHPL magisterský navazující, 2. ročník, zimní semestr, povinně volitelný
  • Program NPCP_CHPL magisterský navazující, 2. ročník, zimní semestr, povinně volitelný
  • Program NPCP_PCHBT magisterský navazující, 2. ročník, zimní semestr, povinný

Typ (způsob) výuky

 

Přednáška

13 hod., nepovinná

Vyučující / Lektor

Osnova

Cílem předmětu Biostatistika a zpracování dat je osvojit si základní principy hodnocení a zpracování výsledků chemických a biologických procesů základními a pokročilými statistickými metodami. Zásadním posláním předmětu je předat znalosti o způsobu extrakce informací z velkých datasetů a získali schopnosti aplikovat základní statistické testy. Tyto znalosti jsou esenciální pro objektivní interpretaci výsledků vědeckých studií a při psaní odborných textů.

Předmět se zaměřuje na specifickou oblast statistiky, kterou lze efektivně využívat při zpracování dat z medicínské ale i přírodovědné a chemicko-technologické oblasti. Podrobně jsou rozváděna témata z okruhu základní i pokročilé deskriptivní analýzy, testování hypotéz, korelační a regresní analýzy a komplexní vícerozměrné analýzy dat. Teoretické znalosti z přednášek jsou přeneseny do praxe pomocí cvičení, v nichž si studenti osvojí využití pokročilého statistického softwaru – Statistica. Během cvičení jsou řešeny konkrétní problémy nejen na modelových datech, ale i na vlastních datasetech studentů, které získali z vlastních experimentů z probíhajících diplomových prací.

1. Úvod do biostatistiky, základní statistické pojmy a metody
2. Teorie pravděpodobnosti, distribuce dat, centrální limitní věta
3. Z a T distribuce, standardizace hodnot pomocí Z a T skóre, interval spolehlivosti, bodové odhady střední hodnoty, intervalové odhady střední hodnoty, posouzení správnosti a shodnosti výsledků, systematizace a eliminace chyb
4. Základní deskriptivní analýza dat – grafy, testy normality, identifikace odlehlých výsledků
5. Výběr a návrh designu experimentu
6. Parametrické hypotézové testy (T-testy, ANOVA)
7. Neparametrické hypotézové testy (U-test, Kruskal Wallisova ANOVA)
8. Korelační a regresní analýza dat
9. Aplikace lineární regrese v biotechnologické a chemické praxi. Polynomická regrese, určení stupně polynomu. Tvorba modelů.
10. Vícerozměrná analýza dat  – Shluková analýza – hierarchická, K-průměr
11. Vícerozměrná analýza dat  – Analýza hlavních komponent (PCA)
12. Vícerozměrná analýza dat – Diskriminační analýza
13. Tvorba klasifikačních modelů pomocí diskriminační analýzy 

Cvičení přímo navazuje na přednášky, kde studenti řeší konkrétní statistické problémy za použití softwarů Statistica a Excel.

Konzultace v kombinovaném studiu

26 hod., nepovinná

Vyučující / Lektor

Cvičení

13 hod., povinná

Vyučující / Lektor

eLearning