MSG830 H21 Statistisk Analys och Experimentplanering
Tenta
Tentan från 14 januari 2022 finns här, eller med lösningar här. Övriga tentor med lösningar: 18 mars 2022, 8 juni 2022, 18 augusti 2022.
Kursinformation
Kursen består av två delar, en teoretisk del (6hp) med föreläsningar, övningar och datorlaborationer och ett obligatoriskt projekt (1.5 hp). Kurslitteratur är ett kompendium.
På denna sida finns preliminära programmet för kursen: föreläsningar, räkneövningar och datorlaborationer. Beskrivning av projektet hittar du efter programmet.
För laborationerna och projektet behövs statistikprogramvaran RStudio som kan laddas ner i två steg
Steg 1: installera R från http://ftp.acc.umu.se/mirror/CRAN/ (Links to an external site.)
Steg 2: installera RStudio från https://rstudio.com/products/rstudio/download/ (Links to an external site.)
Inga förkunskaper i programmering krävs.
För dig som inte har egen dator finns möjligheten att göra labben i datasalen MVF22. Du måste då se till att du har konto på Chalmers vilket du skaffar via biblioteket.
Program
| Datum | Tid | Aktivitet | Innehåll | Avsnitt i kompendium |
| Onsdag 3 nov | 10:00-11:45 | Föreläsning | Datatyper, Deskriptiv statistik | Kapitel 1 |
| Torsdag 4 nov | 13:15-15:00 | Föreläsning | Sannolikhetsteorins grunder, Kombinatorik, Betingad sannolikhet, Oberoende händelser, Bayes formel | Kapitel 2 |
| Tisdag 9 nov | 10:00-11:45 | Övning |
Övningar i Kapitel 1 och 2: |
1.8.1, 2.6.1, 2.6.2, 2.6.3, 2.6.4, 2.6.9 |
| Tisdag 9 nov | 13:15-15:00 | Datorlab | Beskrivande statistik | Lab 1 |
| Onsdag 10 nov | 10:00-11:45 | Föreläsning | Diskret slumpvariabel, Fördelning, Väntevärde, Varians, Binomial, Poisson, Stora talens lag | Kapitel 3 |
| Torsdag 11 nov | 13:15-15:00 | Föreläsning | Kontinuerlig slumpvariabel, Täthet, Likformig, Normal, Centrala gränsvärdessatsen | Kapitel 4 |
|
Tisdag 16 nov |
10:00-11:45 | Övning |
Övningar i Kapitel 3 och 4: |
3.8.1, 3.8.4, 3.8.7, 4.4.2, 4.4.4, 4.4.6 |
| Tisdag 16 nov | 13:15-15:00 | Datorlab | Binomial och normalfördelning | Lab 2 |
| Onsdag 17 nov | 10:00-11:45 | Föreläsning | Population och stickprov, Medelfel, Konfidensintervall, Hypotesprövning | Kapitel 5 |
| Torsdag 18 nov | 13:15-15:00 | Föreläsning | t-fördelning, 1-stickprov t-test | Kapitel 6 |
| Tisdag 23 nov | 10:00-11:45 | Övning | Övningar i Kapitel 5: | 5.6.2, 5.6.3, 5.6.4, 5.6.6, 5.6.7 |
| Tisdag 23 nov | 13:15-15:00 | Datorlab | Medelvärde och medelfel | Lab 3 |
| Onsdag 24 nov | 10:00-11:45 | Föreläsning | Teckentest, 2-stickprov t-test, Parat t-test | Kapitel 6 |
| Torsdag 25 nov | 13:15-15:00 | Föreläsning | Försöksplanering och Projekt | Kapitel 10a |
| Tisdag 30 nov | 10:00-11:45 | Övning | Övningar i Kapitel 6: | 6.7.1, 6.7.2, 6.7.3, 6.7.4, 6.7.5, 6.7.6, 6.7.7, 6.7.8 |
| Tisdag 30 nov | 13:15-15:00 | Datorlab | Konfidensintervall | Lab 4 |
| Onsdag 1 dec | 10:00-11:45 | Föreläsning | ANOVA, Multipla jämförelser, Bonferronis metod | Kapitel 7 |
| Torsdag 2 dec | 13:15-15:00 | Föreläsning |
Enkel linjär regression, Hypotesprövning av lutning, Analys av residualer, Korrelation (Pearson), t-test av korrelation |
Kapitel 8 |
| Tisdag 7 dec | 10:00-11:45 | Datorlab | t-test och ANOVA | Lab 5 |
| Tisdag 7 dec | 13:15-15:00 | Datorlab, övningar | Regression, övningar 8.3.4, 8.3.7 | Lab 6 |
| Onsdag 8 dec | 10:00-11:45 | Föreläsning | Gästföreläsning | Carl-Fredrik Burman, AstraZeneca |
| Torsdag 9 dec | 13:15-15:00 | Föreläsning | Chi-två test, Chi-två fördelning, Goodness-of-fit test, Test av oberoende | Kapitel 9 |
| Tisdag 14 dec | 10:00-11:45 | Övning | Övningar i Kapitel 7-9 | 9.3.1, 9.3.2, 9.3.3b, 9.3.4, 9.3.5, 9.3.6, 9.3.7, 9.3.8 |
| Tisdag 14 dec | 13:15-15:00 | Datorlab | Chi-två test | Lab 7 |
| Onsdag 15 dec | 10:00-11:45 | Föreläsning | Försöksplanering och Beräkning av stickprovsstorlek | Kapitel 10b |
| Torsdag 16 dec | 13:15-15:00 | Föreläsning | Handledning av projekt | |
| Tisdag 4 jan | 10:00-11:45 | Övning | Kapitel 1-10 | |
| Tisdag 4 jan | 13:15-15:00 | Datorlab | Lab 6-7 (i mån av tid) | |
| Onsdag 5 jan | 10:00-11:45 | Övning | Genomgång av typtentan | Typtenta |
| Torsdag 6 jan | 13:15-15:00 |
Trettondagen |
Inget | |
|
Fredag 14 jan |
8:30-12:30 |
Tentamen | Se Examination nedan |
Kurslitteratur
Vi kommer att använda ett Kompendium författat av Staffan Nilsson, Aila Särkkä och Serik Sagitov. Kompendiet är nu uppdaterat och alla kapitel finns med.
Utöver kompendiet kan du även läsa någon grundläggande bok i statistik, t ex Milton & Arnold: Introduction to probability and statistics.
Examination
Examinationen består av två delar, en skriftlig tentamen och ett projekt. För projektet ges bara betygen U eller G, medan för den skriftliga tentamen ges betygen U, G eller VG.
Den 9 december har vi gått genom alla de viktigaste testen och senast då är det dags att börja jobba med projektet. Rapporten ska lämna in senast den 31 januari, men ju förr desto bättre.
För tentamen gäller följande.
- Hjälpmedel 1: valfri miniräknare (inget avancerat förväntas, utan det räcker med grundläggande addition, subtraktion, multiplikation, division, roten ur)
- Hjälpmedel 2: egenskriven formelsamling, där ni får använda båda sidorna av ett blad A4. Det finns inga begränsningar för vad bladet får innehålla, t.ex. gamla tentamenslösningar är OK.
- Relevanta tabeller (för beräkningar av t.ex. sannolikheter och kvantiler) kommer med tesen.
- Minst en fråga kommer handla om att tyda R-kod.
Projekt
Syftet med projektet är att ni i grupper av 3-4 personer ska pröva på att planera ett projekt som sedan ska analyseras med statistiska metoder ni lärt på kursen. Att forska ska vara roligt. Välj någonting som intresserar er, det blir bättre då. Det är förstås bäst om ni kan hitta på ett projekt inom ert huvudämne, men det går också fint med något som ni bara tycker är intressant i största allmänhet. Ni kan välja att utföra experiment av något slag, men också observationsstudier går bra.
Ett minimikrav på projektet är att ni genererar data, beskriver data med lämpliga mått och plottar och utför minst ett statistiskt test. Det går inte att garantera signifikanta resultat, men ni bör åtminstone ha en forskningshypotes som rimligen kan vara sann.
Några exempel på vad som har studerats i tidigare projekt:
Användning av Swish, Punktlighet hos spårvagnar, Tobakskonsumtion, Pepparkakstest, Ekologisk konsumtion, Prisskillnader mellan kravmärkt och vanlig produkt, Matvanor (veg, fisk, kött), Julmusttest, Kaffekonsumtion, Klimatförändringar i Oslo sen 30-talet, Sociala medier och stress, Kost-träning-utseendefixering, Studenters lunchvanor, Hur spricker Mariekex (modell för tektoniska plattor), Trafikflöde och trängselskatt, Sömnvanor, Dendokronologi i Skogaby, etc
Stäm av projektidén med Tony innan ni börjar projektet.
Rapporten ska innehålla en inledande beskrivning av frågeställningen och beskrivning av data, ett metodavsnitt där ni beskriver försöksupplägget, metoden/metoderna ni har använt och ger era noll- och forskningshypoteser, en resultatdel där resultaten av era analyser presenteras och en avslutande diskussion. Resultaten kan beskrivas i ren text och med egenkonstruerade tabeller, men bifoga också den R output som ligger till grund för framställningen, samt de datafiler du använt. I diskussionen bör ni diskutera antaganden ni har gjort och om de stämmer och begränsningar av er undersökning.
Rapporten lämnas in i Canvas senast den 31 januari, 2022. Endast en i gruppen behöver lämna in rapporten. Glöm inte ange samtliga gruppdeltagares namn på rapporten.
Kurssammanfattning:
| Datum | Information | Sista inlämningsdatum |
|---|---|---|