206 Matching Annotations
  1. Mar 2025
    1. Statistical models

      Warning sobre l'ús i l'objectiu del models

      -Adjust for confounders when evaluating intervention effects.

      -Use DAGs when assessing causal relationships.

      -Internally and externally validate predictive models.

      -Exploratory analyses allow more flexibility, but model assumptions must always be checked.

    2. We can estimate

      En lloc de 2 diapos podrien ser 3. La primera fins a la formula. La segona de "We can estimate..." fins al final del codi del model". I la tercera amb l'output del mode. Què et sembla?

    3. ng some disease

      Es fa estrany que els altres dos exemples siguin concrets i aquest no. Seguint amb el que deies a la diapo anterior:

      Evaluating whether a patient responds to a treatment for hypertension.

    4. fits the data best than m1

      Existeix un test sobre la versemblança. lmtest: lrtest et compara models niuats via el likelihood ratio test.

    5. anova

      Ai, ai... que me'ls liaràs... és broma... els pots fer veure que comparar la SS residual i si la reducció quan afegeixes sexe paga la pena.

    6. Assessing outliers

      Faltaria llistar les condicions del model o ho diràs de veu? Independència Normalitat del residus Homogeneïtat de les variàncies

    7. larger than 1

      Compte, la interpretació també ha de considerar el context i el leverage de les dades. Aquest 3 punts podrien ser un problema en el context d'aquest estudi.

    8. plot(m1,1)

      Comentar que aquests no estan estandarditzats i per tant estaran centrats en 0, però tindran un rang de variació en funció de la desviació estàndard dels propis residus.

    9. β0=82β0=82\beta_0=82: the expected value of systolic blood pressure when age = 0 (senseless)

      Els hi explicaràs com fer-ho perquè tingui sentit?

    10. if age increases one year, SBP increases in 0.90.90.9 mmHg.

      The expected SBP value for a subject with one year more would be 0.9 mmHg higher, for a subject with 5 more years 4,5 mmHg more.

    11. Correlation

      Aquí és important que diguis que no hi ha jerarquia entre les variables. X sobre Y ó Y sobre X ho llegirem igual.

      I també està pensada per raons linials i que si no ho són la rho no és interpretable (feu el gràfic). Els podries mostrar el quartet de Anscombe's

    12. Do not interpret the p-value in a correlation test.

      T'has passat... ;)... si tens, com els passa als genetistes, una matriu de 1000x1000 o més per algun lloc has de començar a descartar... no ens agrada, però és realista. Trauria la frase, però comentaria de veu les greus limitacions.

    13. and it indicates whether XXX has a statistically significant effect on YYY.

      uhm... "indicates whether there is statistically significant evidence that X is associated with Y"

    14. To establish a relationship between YYY and a predictor variable X

      No m'acaba de convencer això d'establish:

      To quantify the relationship between a dependent variable Y and a predictor variables X

    15. Depending on the nature of the response variable YYY there are different types of models

      Per lligar-ho amb el títol de la presentació aquí podries anunciar o definir els GLM i explicar-ne 4 tipus en funció de la variable dependent i la seva distribució. I dir que n'hi ha més.

      Els Cox no són GLM per tant ni els mencionaria.

    16. Find risk factors associated with high blood pressure

      Millor amb un exemple concret.... What is the effect of sugary drinks (X) on diabetes risk (Y)?

    17. Build a prognostic index to predict the values of YYY given explanatory variables XiXiX_i

      Estimate a clinical prediction model to predict the risk of diabetes (Y) given a subject's demographic and clinical characteristics (X_i)

    Annotators

    1. The most commonly used measure of effect size for a t-test is Cohen’s d

      Cohens d is a standardized effect size for measuring the difference between two group means:

    2. Wilcoxon rank-sum test

      Delete. És molt interessant per nosaltres però diria que irrellevant per ells en un curs com aquest (falta temps per tot arreu).

    3. The p-value is derived from the smaller UUU of the two groups: Umin=min(U1,U2)=min(16,14)=14Umin=min(U1,U2)=min(16,14)=14U_{\text{min}} = min(U_1, U_2) = min(16, 14) = 14 R calculates the p-value based on UminUminU_{\text{min}}.

      Delete

    4. Paired samples

      In a dependent sample, the measures are related.

      For example, if you take a sample of patients who have had a painkiller and ask them about their pain before and after taking the medicine

    5. Independent samples

      Independent samples are samples that are selected randomly so that its observations do not depend on the values other observations.

      For example, if the men's group and the women's group are asked about their health status.

    Annotators

    1. counting the number of observations in each bin

      També és poden fer amb %'s o densitat. Potser diria:

      Histograms are constructed by binning the data and counting the number of observations in each bin, or the percentage or density:

    2. ways of representing graphically the distribution of a numerical variable is

      types of graphical representation of the distribution of a numerical variable are

    3. mean

      Al text podries referenciar la M de la mitjana de la figura. De totes maneres la Me es fa servir per la mediana i la mitjana es presenta amb un $\bar{x}$. És possible modificar la figura?

    4. Percentiles

      Això no pot anar aquí. Et proposo el següent ordre: Standard deviation Range Interquartile range ... i aleshores aprofites per explicar què és un percentil de veu o en una slide extra. Què et sembla?

    5. If there is an even number of observations take the average of the two center values.

      Ho pots dir, però no crec que calgui indicar-ho.

    Annotators

    Annotators

    1. ggcoxzph(test.ph)

      Si fas dos columnes, i mostres els gràfics 2 i 1, diria que es podran veure millor.

      Ok. No havia vist les següents diapos... però aleshores potser no els mostraria aquí.

      Trobo a faltar una variable que presenti problemes, per exemplificar l'aspecte del gràfic.

      Ok. Ara he arribat a la diapo amb l'exemple amb problemes. No seria la bomba, però potser no en tens cap altre.

      Pots riure.

    2. assumption

      Es podria afegir un darrer punt advertint de la sensibilitat d'aquest test. Si la n és relativament gran pot produir falsos positius (mirar gràfics)

    3. We can visualise the table of results (HR, 95% CI and p-values) using tbl_regression() from gtsummary package, with the exponentiate option set to TRUE to return the hazard ratio rather than the ββ\beta coefficient:

      El text no respira massa. Què tal així?

      We can visualise the model results in a fancy table:

      • Using tbl_regression() function from gtsumary package
      • Specify exp=TRUE to show Hazard Ratio.
    4. Cox regression models

      Uhm... no aniries directament a la interpretació dels HR? Interpretar les betes a 0 per després passar als HR a 1 potser es foten un embolic, no?

    5. Are there differences in survival between sexes

      Are the survival functions different for sex?

      Are survival functions different between sexs?

    6. High survival rate

      Depèn com es miri... vull dir que a l'any ha palmat el 60%. Crec que és més interessant que comentis la pendent. A l'esquerra moren tots i ràpid. A l'esquerra moren menys però a ritme més lent.

    7. T

      T ho explicaria com temps a seques, com t. El parèntesis el posaria amb el Survival time. Com ho veus? Es fa estrany llegir dos cops el mateix. Després quan expliques la formula pots especificar què vol dir T

    Annotators

    1. Joining Datasets

      Després de repassar tot el capitol de "Joining Datasets", per practicat em limitaria a ensenyar el left_join directament amb el by. Ho podem comentar

    2. For the following examples of joining datasets, we will use these built-in datasets

      For the following examples we will use these built-in datasets

    3. into your R session

      Aquí podríeu dir allò de instal·lar i carregar a la biblioteca de paquets de la teva sessió d'R. Així entendran perquè això de library(xxx).

    4. A data frame is composed of vectors and all vectors must have the same length.

      Faria servir exactament la mateixa definició que s'ha donat a la sessió anterior.

    Annotators

    1. Set of R packages which provide, among other things, convenient methods for managing data

      A set of R packages ideal for data management. They will make your life a lot easier.

    2. An operation applied in a vector will be applied elementwise to each one of its elements.

      Potser és més simple així... a veure què us sembla... When you perform an operation on a vector, the operation is automatically applied to each individual element of the vector.

    3. R comes with some basic arithmetic operations that can be used on

      In R, basic arithmetic operations that can be performed on a single numeric object, a numeric vector, a numeric matrix or a dataframe with numeric columns.

    4. R is case sensitive so daily_cigar is considered to be different to Daily_Cigar

      R is case sensitive, so daily_cigar is different to Daily_Cigar.

    5. A factor is a special kind of vector

      Entenc la idea, però potser podria ser interessant vendre-ho com una manera de construir variables categòriques. Alguna cosa com ara... "A factor is a categorical variable that stores discrete values as labeled levels, which can be ordered or not."

    6. Single value that can be numeric, character, logical, datetime, etc.

      A single value that can be a numeric, a character, a logical, a datetime, etc.

    Annotators