Visar inlägg med etikett Statistik. Visa alla inlägg
Visar inlägg med etikett Statistik. Visa alla inlägg

lördag 18 augusti 2012

Sisyfos och "kunden har alltid rätt"

Jag ägnade ungefär en arbetsdag den här veckan åt att ändra ett script för en automatgenererad graf (som en Kollega skrivit) till en mindre elegant lösning som Beställaren ville ha. Grafen byggde på en hel del smart kod som var svår att arbeta bort och jag började till slut om från början.

Har nu lika mycket dokumentation som kod i scriptet, och har lagt in möjligheter att ändra utan att slita koden i småbitar. Inte snyggt, men användbart. Bättre eller sämre än det var från början?

fredag 17 augusti 2012

Fredag

Idag är sista dagen på kursen så ikväll bär det av till den kungliga huvudstaden igen!

Bifogar bild på kursboken som jag ger betyg @@@ av @@@@@

Mer info om boken

måndag 6 augusti 2012

Statistikern och det ologiska

Det (de) ologiska är statistikerns kryptonit. Tidigare har jag trott att oändligt tålamod var enda försvaret, men det är inte riktigt sant. Med noggrann versionshantering (Git eller allmän nit) kan man åtminstone spåra galenskapen. Det lättar upp humöret.

måndag 4 juni 2012

Vad är orsaken till kausala grafer?

Sitter och sliter mitt hår över en kausal graf. Eller inte över själva grafen då, utan över data. Som vanligt döljs hälften av vad jag skulle vilja se av ett udda urval. Udda urval ger mig huvudvärk, trots att jag disputerat på dem.

[Bilden har ingenting med data i texten att göra.]


måndag 14 maj 2012

Det var bättre förr

Vem har raderat alla excel-inläsnings-funktioner från R-version 2.15.0 (Mac)? Jag kör nu version 2.14.2 och surar.

onsdag 9 maj 2012

Olika färger i R

Förut hade jag en kollega som gjorde små R-funktioner åt mig när jag gnällde om att R inte gjorde saker som jag ville. Vill ni bli lika omtyckta som honom, tipsa mig om hur man löser problemet nedan:)

En sak som jag länge tänk på som är irriterande med R är att det är samma färg på output, varnings- och felmeddelanden i konsolen. Detta måste man väll kunna ändra i detta fantastiska program?! Frågan är hur, min snabba sökning på Google hjälpte föga - några tips?

onsdag 2 maj 2012

Data till kolumner

En av de få saker jag gillar med Excel är funktionen "data till kolumner". Jag har därför just suttit och programmerat en motsvarande funktion till R (fick ett dataset i behov av en del handpåläggning från en klient).  Och nej, jag vill inte veta om det redan fanns!

Kod nedan. (Skönhetsupplevelse utlovas ej!)



data.to.columns<-function(Oldcol, Separators){
  antal<-nchar(as.character(Oldcol), type="chars")
  maxantal<-max(antal)
  tempframe<-as.data.frame(matrix(NA,length(Oldcol),maxantal))
  new.col<-as.data.frame(matrix(0,length(Oldcol),maxantal))
  col.assign<-as.data.frame(matrix(0,length(Oldcol),maxantal))
    for (i in 1:maxantal){
    tempframe[antal>=i,i]<-substr(Oldcol[antal>=i],i,i)

    for (separators in 1:length(Separators)){
       new.col[!is.na(tempframe[,i])&tempframe[,i]==Separators[separators],i]<-1
    }
    if (i==1){
      col.assign[!is.na(tempframe[,i]),i]<-1}
 
    if (i>1){
    col.assign[!is.na(tempframe[,i]),i]<-new.col[!is.na(tempframe[,i]),i]+col.assign[!is.na(tempframe[,i]),i-1]}
    }

for (i in 1:maxantal){
  col.assign[new.col[,i]==1,i]<-0
}
n.new.col<-max(apply(new.col,1,sum))+1
new.data<-matrix("",length(Oldcol),n.new.col)
for (columns in 1:n.new.col){
  for (i in 1:maxantal){
      new.data[col.assign[,i]==columns,columns]<-(paste(new.data[col.assign[,i]==columns,columns],tempframe[col.assign[,i]==columns,i], sep=""))
    }
  }
new.columns<-as.data.frame(new.data)
return(new.columns)
}

Exempel:


testdata<-c("NA","34+15+Okänt","45+35+NA+17", "2+4", "35 NA" )
data.to.columns(Oldcol=testdata, Separators=c("+"," "))

fredag 27 april 2012

Bibliotekarie?

Eller vad får man för titel när man skapat sitt första R-bibliotek?

tisdag 24 april 2012

Definition på förtroende

Dagens roligaste läsning:

”Förtroende” enligt SOM-institutets undersökning är antalet personer som känner stort eller ganska stort förtroende minus antalet personer som känner mycket eller ganska litet förtroende.


Differensen ger sedan ett balansmått i form av en procentsiffra.

söndag 22 april 2012

SPSS, STATA och R...

...har jag spenderat alldeles för mkt tid med idag :) ska nog fortsätta att virka lite på min uggla och njuta av de sista lediga timmarna innan jobb 24/7 väntar i veckan!

Vad gör ni en regnig sön som denna?