147 Matching Annotations
  1. Mar 2025
    1. For obese, OR=3.80 -> Obese individuals have higher odds of developing diabetes than non-obese individuals

      ara estava pensant si a la interpretació dles models multiples que has ficat s'hauria de ficar sempre for the same age and bmi category

    2. #?PimaIndiansDiabetes table(df$diabetes) neg pos 500 268 table(df$diabetes)["pos"] pos 268 df |> select(diabetes) |> tbl_summary()

      jajaj t'has pasao fent-ho de tres formes diferents. Jo faria un tbl_summary i afegiria a l'enunciat que reportin en una taula el número de positiius i negatius de la diabetes

    3. PimaIndiansDiabetes consists of several medical predictor variables and one target variable, diabetes. This dataset is originally from the National Institute of Diabetes and Digestive and Kidney Diseases of the USA and includes data on female patients at least 21 years old of Pima Indian heritage.

      en un callout note

    4. Fit the model and interpret its coefficients.

      Ficaria un d. que digués build a table perquè sapiguen que han d'utilitzar tbl_regression.

      També ficaria un punt abans que digués de visualitzar la relació no? I verificar que és lineal abans de fer el model

    5. The regicor dataset consists of data from 3 different cross-sectional surveys of individuals representative of the population from a north-west Spanish province (Girona), REGICOR study.

      Ficar-ho igual que en el de survival no?

    Annotators

    1. Useful to investigate the effect of a set of predictor variables in a response variable

      afegiria que a vegades volem estudiar l'efecte d'una variable d'interès ajustat per un set de covariables.

    2. Comparison of linear models

      aquí desapareix el R2 que també es podria fer servir per a comparar models no? Almenys l'ajustat.

      Al final diria que l'AIC és el més recomanat, que al final és el que sempre utiltizem nosaltres no?

    3. linear

      crec que és molt important aquest punt! s'hauria de resaltar d'alguna forma i dir que si no és lineal hi ha altres models però que no es faran en aquesta sessió

    4. Linear regression

      bueno ojo perquè si no és lineal... el mateix per la logistic regression!! afegiria un punt de chequear la linealitat de la relació! i dir que hi ha opcions no lineals.

      També, ara que hi penso no s'ha parlat de colinealitat en multiple regression, val la pena?

    5. regicor3$pred <- predict(m3, type="response", data=regicor3) head(regicor3 |> select(id,smoker,bmi, death,pred))

      aqui ho fas diferent, fas el select dins del head. Faria el mutate i el select i després el head. Sino es marejaran

    6. Logistic model (qualitative and quantitative variable)

      se'm fa raro que l'estructura és diferent de la de linear model, que tenies simple/multiple i ara fas continua/categorica/continua+categorica

    7. OR = 1.13 ⟶⟶\longrightarrow For a 1-unit increase in the bmi, the odds of dying are increased by 13%.

      ho ficaria amb una altra fletxa a continuació del punt atnerior sense que fos un nou punt

    8. Introduction

      Com que després introdueixes un exemple potser podries partir d'aquest exemple tot el rato, no? Si no se'ls farà més dificil d'imaginar

    9. newdata$pred <- predict(m2, type="response", newdata=newdata)

      pots fer-ho amb un mutate i ensenyar la sortida de l'output no cal tornar a ficar 'newdata' aleshores. Igual pel següent

    10. newdata <- data.frame(age=70, sex="Male") #define new data newdata$pred <- predict(m2, type="response", newdata=newdata) newdata

      aquí igual que abans i així no cal ni assignar-ho a newdata. Pots ficar el mutate i que es visualitzi l'output

    11. Both p-values are lower than 0.05 ⟶⟶\longrightarrow Both age and sex are associated with SBP

      Ho ficaria al final. Ficaria associated significantly.

    12. If XiXiX_i is qualitative

      per què això no ho has ficat en la simple linear regression? també ho podríem tenir, se'm fa raro que es digui només aquí

    13. predictor

      No sé si es faran un lio amb explanatory/predictive modelling. Perquè a més també es podria dir explanatory variable. Pot ser tant aquí com a dalt parlaria de independent variable?

    14. p-value for age <0.001⟶<0.001⟶<0.001 \longrightarrow Age has a statistically significant effect on SBP

      al final potser? primer parlar de B1 i després de si té un efecte significatiu

    15. xlab("Age") + ylab("Systolic blood pressure") +

      faria servir labs() així no has de fer xlab i ylab que ho fiques a la mateixa línea sense salt de linea

    16. Example dataset: REGICOR study

      es podria veure millor aquesta taula? no es veu massa bé. Si li fas un as.tibble(regicor)? o pots fer trampes i fer-li un gt de fons jeje

    Annotators

    1. 12. Test the proportional hazards assumption for model2.

      buf estan al límit algunes. Faries algun Schoenfeld plot? Se'm fa raro que no extreguis cap interpretació d'aquí.

    2. 11. Reorder the levels of variable platelet with meaningful order and fit a Cox model again.

      Això ho haurien d'haver fet ja al punt 1. Ho afegiria allà junt amb el missatge que et deia abans de converteix en factor les variables amb un ordre. Per tant aquest exercici el treuria.

    3. Increasing albumin lower the odds of dying

      Ficaria la interpretació completa d'un HR: for a patient who has not died by a certain point in time increasing albumin lowers his risk of dying. Diria que és risk i no odds.

    4. Use summary() on a survfit object to obtain survival estimates at specific time points.

      Potser faria un tip general pel punt 4 que fos: use the survfit object. Valorar aleshores si treure aquest o no.

    5. status

      perquè s'enrecordin que ha de ser numèrica els hi pots ficar al tip algo així: remember that the response used inside 'Surv()` has to be numeric. Crec que no és baladí

    6. mutate(trt=factor(trt, labels=c("D-penic", "Placebo")), hepato=factor(hepato, labels=c("No", "Yes")), status2=factor(status, labels=c("Alive", "Dead")))

      fica els levels també, perquè sempre va bé no deixar-sels. Així a més entenen com funciona la sintaxis de factor

    7. A description of the variables is given below:

      això també ho pots ficar dins un callout note i ho pots fer collapsable perquè no els hi ocupi tant d'entrada. El codi és: ::: {.callout-note collapse="true"} :::

    8. The file PBCdata.txt contains a subset of data from a trial on primary biliary cirrhosis (PBC) of the liver conducted in the Mayo Clinic between 1974 and 19841. The patients were randomized to receive placebo or the drug D-penicillamine. The objectives in this study were to compare D-penicillamine and placebo in terms of survival and to find prognostic factors.

      Fica-ho tot dins un callout note no? jeje

      La file haurà d'estar a una carpeta dins de Data

      Mola el 19841, estarem vius?

    Annotators

    1. #Shapiro-Wilk WeightLoss_long |> group_by(Time, group) |> summarise(p_value = shapiro.test(Weight)$p.value)

      si ho treus el gràfic et queda més gran

    2. # Arrange results results_anova <- broom::tidy(model_anova) resultats_anova$term<-c("Between-groups","Within-groups") names(resultats_anova)<-c("Terms","df","SS","MSQ","F","P-value")

      comentari que et diu el João més tard també (aquí no ho ha ficat)

    3. #Shapiro-Wilk ToothGrowth |> group_by(dose) |> summarise(p_value = shapiro.test(len)$p.value)

      però els hi hem dit que no ho utilitzin, no? potser ho treuria i així es veur`amillor el qqplot

    Annotators

    1. Complete this step, since the upcoming examples will rely on this dataframe.

      Creo que es mas natural hacerlo al final de explicar todos los selects, y dices que te quedas con las variables que vas a usar en los siguientes ejemplos. Además, haría el select con los nombres de las variables en vez de la posición después

    Annotators

    1. Non-proportional hazards

      Al final si fiques el gràfic? Realment no es veu molt la crescuda, no? Potser és un tema de sensitivitat i és que no es viola l'assumpció. Considerar ficar l'explicació i treure el gràfic?

    2. Model validation: Graphs of Schoenfeld residual

      La transició entre la diapo anterior i aquesta no l'acabo d'entendre. Potser ficaria els dos bullets en la diapo anterior i aquí ja entrar amb el [1]

    3. h(t|X1,X2,…,Xp)=h0(t)⋅exp(β1X1+β2X2+⋯+βpXp)h(t|X1,X2,…,Xp)=h0(t)⋅exp⁡(β1X1+β2X2+⋯+βpXp)h(t | X_1, X_2, \ldots, X_p)=h_0(t) \cdot \exp(\beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_p X_p) X1,…,XpX1,…,XpX_1, \ldots, X_p: Variables of interest. h0(t)h0(t)h_0(t): Baseline hazard function. β1,…,βpβ1,…,βp\beta_1, \ldots, \beta_p: Regression coefficients of each variable.

      li falta indent a la formulació, no? Potser si fiques $$ en lloc de $ s'arregla?

    4. Aims

      No faria una secció gran (només un #) per només una diapositiva. Ho deixaria dins de la introducció. A més potser en lloc de aims ficaria types, valorar.

    5. Introduction

      No ho ficaries tot en una mateixa diapo? Per espai et cap, i crec que donaria més consistència. Potser es podria moure l'anterior definició de Survival time després del primer punt d'aquesta diapo.

    Annotators

  2. Apr 2024

    Annotators