\documentclass[a4paper,10pt]{article}
\usepackage[danish]{babel}
\usepackage[latin1]{inputenc}
\usepackage{amsfonts}
\usepackage{latexsym}

\newenvironment{theorem}{$\mathbf{Sætning:}$} {}


\begin{document}

\section*{Stastistik og Databehandling på en TI-83}
Af Jonas L. Jensen (jonas@imf.au.dk).

\section{Fordelingsfunktioner}
Husk på, at en fordelingsfunktion for en stokastisk variabel $X$ er
funktionen
\[ F_X(t) = P(X \leq t) \]
og at variable med samme fordeling har samme fordelingsfunktion. Disse
kan vi finde på vores TI-83 (eller lignende) ved hjælp af
cdf-kommandoerne, der findes under DISTR (2nd + VARS). Det gør vi på
følgende måde

\paragraph{Normalfordeling}
Lad $X \sim N(\mu, \sigma^2)$. Så er
\[ F_X(x) = normalcdf(-10^{99}, x, \mu, \sqrt{\sigma^2}) \]
Hvis i vil finde $P(a \leq X \leq b)$ gøres det på følgende måde
\[ P(a \leq X \leq b) = normalcdf(a, b, \mu, \sqrt{\sigma^2}) \]

\paragraph{t-fordeling}
Lad $X \sim t[f]$. Så er
\[ F_X(x) = tcdf(-10^{99},x,f) \]
\paragraph{$\chi^2$-fordelingen}
Lad $X \sim \chi^2[f]$. Så er
\[ F_X(x) = \chi^2cdf(0,x,f) \]
\paragraph{F-fordelingen}
Lad $X \sim F[r,s]$. Så er
\[ F_X(x) = Fcdf(0, x, r, s) \]
\paragraph{Binomial-fordelingen}
Lad $X \sim binomial(n,p)$. Så er
\[ F_X(x) = binomcdf(n,p,x) \]
Man kan også finde sandsynlighedsfunktionen $P(X = x) = binompdf(n,p,x)$.
\paragraph{Possion-fordelingen}
Lad $X \sim poisson(\lambda)$. Så er
\[ F_X(x) = poissoncdf(\lambda,x) \]
Man kan også finde sandsynlighedsfunktionen $P(X = x) = poissonpdf(\lambda, x)$.

\section{Data}
På TI-83'eren har man muligheden for at gemme en masse data, for
derefter at analysere det. Tryk \verb|STAT| og derefter
\verb|Edit...| Nu kan du flytte rundt, og fylde data i dine
lister. Her vil jeg henvise til manualen (12-20).

Når vi har indtastet data, er vi klar til at analysere. Tryk
\verb|STAT| og tryk en gang til højre så vi er i menuen
\verb|CALC|. Vælg nu \verb|1:1-Var-Stats|, og indtast så hvilken liste
vi havde vores data i. Hvis det fx var i $L_1$, så tryk
\verb|2nd+1|. Tryk nu på enter. Nu dukker der en masse
op. Bl.a. $\bar{x}$ (skønnet af middelværdien), $\Sigma x$ (summen
af data), $\Sigma x^2$ (summen af data i anden), $S x$ (skøn af
standardafvigelsen, denne kalder vi normalt $s$), samt $Med$
(medianen). Hvis i har to lister med observationer, kan i vælge
\verb|2:2-Var-Stats|, og så indtaste en 2 lister adskilt af \verb|,|
og derefter trykke enter. Så får i noget tilsvarende. 

\section{Test og konfidensintervaller}
Man kan lave test både ud fra data man har i en liste, eller ud fra
udregnede estimatorer. Vi vil nu følge Jens' noter "Estimation og
test: katalog". Alle de statistik-kommandoer vi refererer til, ligger
under \verb|STAT|, under menuen \verb|TESTS|. Jeg vil her angive,
hvilke kommandoer på lommeregneren, der svarer hvilke test i Jens'
noter. 

Men først en smule info om, hvordan man gør. I alle test kan man
øverst vælge mellem \verb|DATA| og \verb|STATS|. Forskellen er om man
har data i en liste, eller om man bare kender nogle
estimater. Derefter skal i enten indtaste jeres hypotese-værdi, samt enten
data eller estimater. Læg mærke til, at i skal angive estimatet for
spredningen (dvs. $s$) og ikke estimatet for variansen ($s^2$), men
det kan jo klares med en lille kvadratrod. Til
sidst skal i vælge jeres alternativ-hypotese. 

Når i skal finde konfidensintervaller, gøres det på nogenlunde samme
måde, hvor i så også skal vælge jeres $1-\alpha$ under
\verb|C-level|. Som regel er denne 0.95.

Jeg vil her gennemgå hvordan i gør i par tilfælde.

\subsection{Normalfordeling: Teste $\mu = \mu_0$, $\sigma^2$ kendt}
Vælg \verb|1:Z-Test...|. Nu kan du vælge at bruge enten indtastet data
(\verb|Data|) eller indtaste dine estimationer (\verb|Stats|). Lad os tage et par eksempler
\paragraph{Data (opg 10.3)} Tast nu vores 18 observationer ind i liste
$L_1$ som beskrevet i afsnittet "Data". Gå nu ind under
\verb|1:Z-Test...| og vælg menuen \verb|Data|. Nu skal vi indtaste
$\mu_0$ og vores kendte spredning $\sigma$ (læg mærke til, at det er $\sigma$, og ikke
$\sigma^2$). 

Under \verb|List| skal i vælge i hvilken liste jeres data er
- i vores tilfælde $L_1$. \verb|Freq| skal være 1. Under $\mu$: skal i
vælge hvad jeres alternativ-hypotese skal være, som regel $\mu \neq \mu_0$. Når alt dette er på
plads skal i flytte cursoren ned til \verb|Calculate| og trykke
enter. Nu får udregnet følgende
\begin{itemize}
\item{Teststatistikken:} $z=1.6$
\item{p-værdien:} $p=.1095985788$
\item{Gennemsnittet:} $\bar{x} = 25.05333333$
\item{Estimat for $\sigma$:} $Sx=.1373274318$
\end{itemize}
I dette tilfælde er vores p-værdi større end 0.05, så vi kan acceptere
vores hypotese.

\paragraph{Stats (opg 10.3)} Dette gøres på nøjagtigt samme måde som
ovenfor bortset fra, at man skal indtaste gennemsnittet ($\bar{x}$)
istedet for sin liste. Så indtast som ovenfor, men skriv $\bar{x} =
25.05333333$, og vælg \verb|Calculate|. I skulle nu gerne få samme
output som ovenfor, bortset fra at den ikke estimerer spredningen.

\paragraph{Konfidensinterval}
I kan finde konfidensintervallet under \verb|7:ZInterval...|. Med
$\alpha = 0.05$ fårmed data fra opg 10.3 dette output: \verb|(24.961,25.146)|.

\subsection{Normalfordeling: Teste $\mu = \mu_0$, $\sigma^2$ ukendt}
Dette gør man under \verb|2:T-Test...|. Fremgangsmåden er  nøjagtig som i afsnittet med ukendt varians, udover at
man ikke skal indtaste spredningen under \verb|Data|, og at man skal
indtaste sit estimat for spredningen under \verb|Stats|. Hvis man
indtaster data fra opg 10.3 får man følgende output
\begin{itemize}
\item{Teststatistikken:} $t=1.647698257$
\item{p-værdien:} $p=.117772002$
\item{Gennemsnittet:} $\bar{x} = 25.05333333$
\item{Estimat for $\sigma$:} $Sx=.1373274318$
\end{itemize}

\paragraph{Konfidensinterval}
Her findes konfidensintervallet under \verb|8:TInterval...|.

\subsection{Normalfordeling: Teste $\sigma^2 = \sigma_0^2$}
Dette kan desværre ikke gøres på en TI-83, men i kan stadig få hjælp
til jeres udregninger, da men fx kan finde $F_{\chi^2[n-1]}((n-1)v)$
ved at skrive $\chi^2cdf(0, (n-1) \cdot v, n-1)$ (beskrevet i afsnittet om
fordelingsfunktioner).

\subsection{Binomialfordelingen: Teste $p=p_0$}
Dette gøres med \verb|5:1-PropZTest|. Nu skal vi indtaste
vores $p_0$, vores observation $x$ og $n$, samt vælge alternativ-hypotesen.
\paragraph{Eksempel: opg. 10.5} Her er $p_0 = 0.008$, $x=11$ og $n=800$. Vores
alternativ-hypotese er $p \neq p_0$. Tryk nu calculate, så skulle i
gerne få følgende output
\begin{itemize}
\item{Teststatistikken:} $z=1.825626826$
\item{p-værdien:} $p=.0679063762$
\item{Gennemsnittet:} $\hat{p} = 0.01375$
\item{Antal elementer} $n=800$
\end{itemize}

\paragraph{Konfidensinterval}
Konfidensintervallet findes her med \verb|A:1-propZInt...|.


\subsection{To normalfordelinger: teste $\mu_1 = \mu_2, \sigma^2_x =
  \sigma^2_y$}
Til dette skal i bruge \verb|3:2-SampTTest...|. Læg mærke til, at i
skal indtaste data eller estimater for to observationer. Her skal i
vælge \verb|Yes| ved \verb|Pooled|, da vi kan antage at varianserne er
ens.

\paragraph{Konfidensinterval} Brug \verb|0:2-SampTInt...|.


\subsection{To normalfordelinger: teste $\mu_1 = \mu_2, \sigma^2_x \neq
  \sigma^2_y$}
Her skal i, som ovenfor, bruge \verb|3:2-SampTTest...|, men her skal i
så vælge \verb|No| ved \verb|Pooled|.

\paragraph{Konfidensinterval} Brug \verb|0:2-SampTInt...|.


\subsection{To normalfordelinger: teste $\sigma^2_x = \sigma^2_y$}
Her skal vi bruge \verb|D:2-SampFTest...|.


\subsection{To binomialfordelinger: teste $p_1 = p_2$}
Dette gøres med \verb|6:2-PropZTest...|. Ofte får i angivet
$\hat{p}_1$ og $\hat{p}_2$, men i testen skal i skrive det observerede
antal $x_1$ og $x_2$. Dem kan i naturligvis finde ved
\[ x_i = \hat{p}_i \cdot n_i \]
og så runde af til et helt tal.

\paragraph{Konfidensinterval} Brug \verb|B:2-PropZInt...|.


\subsection{To binomialfordelinger: log odds ratio}
Den kan ikke laves på en TI-83.


\subsection{Lineær regression: teste hældning}
Dette gøres med \verb|E:LinRegTTest...|. Her kan vi kun teste $\beta = 0$, men det er som regel også det i skal
teste. Læg mærke til, at jeres X-lister og Y-lister passe sammen,
dvs. at første indgang i X-listen skal svare til første indgang i
Y-listen osv. Se bort fra, at der står noget med $\rho$ under
alternativ-hypotesen. Lad os lige tage opg. 14.6 som et eksempel.

\paragraph{Opg 14.6} Indtast husstørrelserne ($x_i$'erne) i $L_1$ og
og huspriserne ($y_i$'erne) i $L_2$. Under \verb|E:LinRegTTest...|
sætter i nu \verb|Xlist| til $L_1$ og \verb|Ylist| til
$L_2$. Alternativhypotesen skal være $\beta \neq 0$. Tryk nu
\verb|Calculate|. Så skulle i gerne få følgende output
\begin{itemize}
\item $t=5.542802202$ (teststatistikken)
\item $p=.0014557765$ (p-værdien)
\item $df=6$ (dette er bare $n-2$)
\item $a=-.0893521966$ (dette er $\hat{\gamma}$)
\item $b=.0106478034$ (dette er $\hat{\beta}$)
\item $s=.1244496227$ (dette er vores spredningsestimat $s$)
\end{itemize}
Da p-værdien er under 0.05, kan vi forkaste vores hypotese om
$\beta=0$, så der er altså en lineær sammenhæng mellem huspriser og husstørrelser.

\subsection{Andre lineær regressions test}
Det kan vi desværre ikke på en lommeregner. Men til udregning af
p-værdierne, kan vores afsnit om fordelingsfunktioner være til nytte.

\section{Lineær regression}
Når i har en liste med x'erne og en liste med y'erne, kan i lave
lineær regression på jeres lommeregner. Det ved at trykke \verb|STAT|,
vælge \verb|CALC| og så trykke \verb|4:LinReg(ax+b)|. Nu skal du
indtaste din X-liste hhv. Y-liste adskilt af \verb|,|. Lad os tage
opg. 14.6 som et eksempel.

Indtast huspriserne under $L_2$ og størrelserne under $L_1$. Vælg så
\verb|8:LinReg(ax+b)| som beskrevet ovenfor, og tryk \verb|L1,L2|. Nu
skulle der gerne stå \verb|LinReg(a+bx) L1,L2|. Tryk nu enter. Nu får
vi følgende output
\begin{itemize}
\item $a = -.0893521966$ (dette er vores $\hat{\gamma}$)
\item $b = .0106478034$ (dette er vores $\hat{\beta}$)
\end{itemize}
Se i øvrigt også 3.10 om regressionstest.

\section{Afsluttende bemærkninger}
For god ordens skyld skal jeg vel lige sige, at bare fordi ens
lommeregner kan så mange fine ting, er det ingen undskyldning for ikke
at forstå stoffet. Hvis i har kommentarer eller tilføjelser, kan i sende dem til jonas@imf.au.dk.

\end{document}
