Biologi

Boxplot, Hardy Weinberg Chi2

Alexander Ibsen, Partner i IVB, Master i skat, LL.M, cand.merc.(jur.)

Claus Gudum Faaborg

august 12, 2024
Boxplot, Hardy Weinberg Chi2
  • Boxsplot
  • Hvad er Hardy Weinberg ligevægt
  • Opgave eksempler
  • Hardy Weinberg med chi2

Brug indholdsfortegnelsen i venstre side til navigation på siden

Boxplot

Et boxplot er et statistisk værktøj, der bruges til at visualisere fordelingen af en datasæt ved at vise medianen, kvartilerne og eventuelle outliers. Det hjælper med at identificere skævhed, variation og sammenligne forskellige datasæt visuelt.

Hvad er boxplot og hvordan laver jeg det?

Boxplot

Resumé af vigtigste poinger fra video: Et boxplot indholder medianen, de nedre og øvre kvartiler samt minimum og maksimum værdierne, ofte med “haler” eller “antenner” for at indikere variation uden for kvartilerne.

  1. Værdierne i et boxplot: minimum, første kvartil (Q1), median, tredje kvartil (Q3), og maksimum.
  2. Boksen: Boksen strækker sig fra Q1 til Q3, og medianen markeres med en linje inde i boksen.
  3. Halerne: Linjer fra boksen til minimum og maksimum værdierne viser datasættets fulde rækkevidde. Eventuelle outliers markeres separat

For at vurdere et resultat af et boksplot, kan man fokusere på følgende aspekter:

  1. Median og kvartiler: Medianen, som er markeret med en linje inde i boksen, viser midtpunktet af dataene. Kvartilerne (Q1 og Q3) afgrænser boksen og repræsenterer de 25% og 75% percentiler. Dette giver et indblik i, hvor de fleste data ligger, og om der er en skævhed i fordelingen.
  2. Interkvartilområde (IQR): Dette er afstanden mellem Q1 og Q3 og repræsenterer spredningen af de midterste 50% af dataene. En større IQR indikerer større variation i dataene, mens en mindre IQR indikerer, at dataene er mere koncentrerede.
  3. Outliers og skævhed: Outliers er data, der ligger uden for “halerne” (whiskers) og kan indikere unormale eller ekstreme værdier. Skævhed kan observeres ved asymmetri i boksen og halerne. Hvis medianen ikke er centreret i boksen, eller hvis halerne er ulige lange, kan det indikere skævhed i dataen

Hardy Weinberg

Hardy-Weinberg-ligevægt er en genetisk model, der beskriver, hvordan allelfrekvenser i en stor, tilfældigt parret population forbliver konstant over generationer, hvis der ikke er evolutionære kræfter som mutation, selektion, migration eller genetisk drift. Modellen forudsætter, at populationen er uendelig stor, og at der ikke sker nogen ændringer i genfrekvenserne. Hardy-Weinberg-ligevægten bruges ofte som et nulpunkt til at identificere, om evolutionære processer finder sted i en population. Hvis allelfrekvenserne ændrer sig, tyder det på, at en eller flere af de antagede betingelser ikke er opfyldt.

Forklaring af hvad Hardy Weinberg ligevægt er:

Hardy Weinberg ligevægt

Resumé af regnereglerne for Hardy Weinberg:

Hardy-Weinberg-ligevægten er en grundlæggende model i populationsgenetik, der bruges til at forudsige fordelingen af genotyper i en population, når visse betingelser er opfyldt. For at beregne frekvenserne af de forskellige genotyper, anvendes følgende ligninger:

  1. Allelfrekvenser:
    • p+q=1
    • Her er p frekvensen af den dominante allel, og q er frekvensen af den recessive allel.
  2. Genotypefrekvenser:
    • p2+2pq+q2=1
    • Homozygot dominant (AA): Frekvensen er p2.
    • Heterozygot (Aa): Frekvensen er 2pq.
    • Homozygot recessiv (aa): Frekvensen er q2.

Disse ligninger forudsætter at:

  • Populationen er uendelig stor
  • Parring er tilfældigt
  • Der ikke er mutationer
  • Ingen migration,
  • Ingen genetisk drift
  • Ingen naturlig selektion

Hvad kan vi bruge Hardy Weinberg ligevægt til?

Forskere anvender Hardy-Weinberg-ligevægten som et værktøj til at forstå og analysere genetisk variation i populationer. Her er nogle af de primære anvendelser:

  • Identifikation af evolutionære kræfter: Hardy-Weinberg-ligevægten fungerer som en nulmodel, hvorfra forskere kan identificere, om evolutionære kræfter som naturlig selektion, mutation, migration eller genetisk drift påvirker en population. Hvis de observerede genfrekvenser afviger fra de forventede Hardy-Weinberg-frekvenser, kan det indikere, at en eller flere af disse kræfter er i spil.
  • Overvågning af genetisk variation: Ved at sammenligne observerede og forventede genotypefrekvenser kan forskere vurdere, om en population er i genetisk ligevægt, eller om der er faktorer, der forårsager ændringer i genetisk variation over tid

Hardy weinberg. Opgave gennemgang

Opgave 1. Her udregnes et eksempel på en opgave med Hardy Weinberg ligevægt:

Hardyweinberg opgave

Opgave 2. Endnu et eksempel på en opgave med Hardy Weinberg ligevægt:

Prøve at løse opgave inden du ser videoen. Her er oplysninger for at kunne løse opgaven:

Ufuldstandig dominans, RR=syg, Rr=”halvsyg, rr= rask. Der er 70.000 raske i en population på 85.000.

Opgaven lyder på at udregne hvor står en andel af populationen der er syge og “halvsyge, ud fra ovenstående oplysninger. Se opgaven for løsning.

Hardy Weinberg Chi2

Her er en mere realistisk anvendelse af Hardy Weinberg. Hvor man skal forestille sig man er forsker der sammenligner en observerede populations allelfrekvens med den teoretiske frekvens man ville forvente hvis populationen var i ligevægt. Grunden til man ville gøre dette kunne være at undersøge om evolutionære kræfter som naturlig selektion, mutation, migration eller genetisk drift påvirker en populationen man undersøger.

Her er opgaven gennemgået, få også forklaret hvordan man udregner Chi i anden, Chi2:

Hardyweinberg ligevægt og Chi i anden test

Der har indsneget sig et par småfejl i denne video, beklager meget

Der er en fejl mht. Antal frihedsgrader til allersidst i video. Antal frihedsgrader er 1 og dermed bliver testsandsynligheden 0.000002. Antal frihedsgrader er 1 når vi som her estimerer hvad p og q er. Når vi ved at forældrene alle er heterozygoter (Aa) så forventer vi (1/4,1/2,1/4) og her er antal frihedsgrader 2.

Hvis man vil have den langhårede forklaring: Antal frihedsgrader = antal parametre vi falder. Som udgangspunkt har vi P(AA) og P(Aa) som de to frie parametre mens P(aa) er resten. Hvis vi bare tester mod (p^2,2*p(1-p),(1-p)^2) så er der 1 parameter og dermed har vi en frihedsgrad, mens modellen (1/4,1/2,1/4) har ingen parametre og dermed frihedsgrader=2

Der er en fejl ved 10:10. summen giver 22,22. og så bliver p=0,000014

Bliv opdateret

Følg med og bliv klogere, når jeg udgiver nye videoer på YouTube

Ibsen Venning Brixius, skatterådgivning og køberådgivning