190 Matching Annotations
  1. Dec 2024
    1. Модель немного нелинейна, так как по графику видим, что зеленая линия не прямая

      Комментарий: Я бы скорее сказал, что все в рамках линейности. Возникновение таких отклонений мне кажется не совсем системным и отражающим какую-то нелинейность...

    2. scale_y_continuous(breaks = scales::breaks_width(0.1))

      Замечание: Здесь стоит уменьшить шаг по оси Y, иначе происходят страшные вещи. breaks_width(50)

    Annotators

    1. Нулевая гипотеза – медианы между группами равны. Альтернативная гипотеза – медианы между группами не равны.

      Ошибка: Более оптимальной будет гипотеза о стохастическом доминировании.

    2. Формы распределений похожи. Возможно формировать гипотезы о равенстве медиан.

      Ошибка: Аналогично заданию №3 формы различаются.

    3. Нулевая гипотеза (H0) – медианы между группами равны. Альтернативная гипотеза (HA) – медианы между группами не равны.

      Ошибка: Нужны другие гипотезы о стохастическом доминировании.

    4. Формы распределений похожи.

      Ошибка: Формы распределений сильно различаются. Если все группы, кроме Very interested еще как-то могут быть похожи друг на друга. Однако группа very interested сильно отличны от них.

    5. смертной казни не различается в зависимости от уровня образования.

      Замечание: Начали с равенства прав между мужчинами и женщинами как важной характеристики демократии закончили смертной казнью

    6. Пост-хок анализ

      Ошибка: Если вы используете непараметрический тест, то пост-хок анализ тоже должен быть непараметрическим.

    7. Отвергаем нулевую гипотезу, дисперсии различны.

      Ошибка: Нулевая гипотеза Levene Test -- дисперсии равны. В данном случае дисперсии равны.

    Annotators

    1. Средние всех групп отличаются друг от друга.

      Ошибка: Опять различие есть только между группами Have done - Might do, Would never do. Различий между Might do и Would never do.

    2. Пост-хок анализ показывает, что все группы различаются друг от друга на статистическом значимом уровне с учетом поправки Бонферонни.

      Ошибка: Есть различие только между группой с высшим образованием и начальным. Однако нет достаточных оснований, чтобы найти различия между группой с высшим образованием и средним, средним образованием и начальным.

    3. Средние всех групп различаются друг от друга.

      Ошибка: Различается только одна группа Higher - Lower. Уровень значимости 0.012

    4. Н0 = медианы между группами равны. НА = медианы между группами не равны.

      Ошибка: Аналогичная ошибка заданию №3. Необходимы другие гипотезы.

    5. Пост-хок анализ показывает, что все группы различаются друг от друга на статистическом значимом уровне с учетом поправки Бонферонни.

      Ошибка: Различается только одна группа. Наиболее заинтересованные политикой (very) в целом выше оценивают значимость проживания в демократической стране.

    6. Группы различаются, а все результаты статистически значимы.

      Ошибка: Такая же ошибка как в первом задании.

    7. Средние групп различаются.

      Ошибка: Статистически значимая разница наблюдается только в двух парах. В одной на 5% Very interested - Not at all insterested (0.041) и 10% Very interested - Somewhat interested (0.087)

    8. pairwise.t.test

      Ошибка: Для пост-хок анализа необходимо использовать такой же тип теста как и для основного анализа. Использование параметрического теста не является оптимальным.

    9. Н0 = медианы между группами равны. НА = медианы между группами не равны.

      Ошибка: В данном случае распределения выборок различаются достаточно сильно. Говорить о равенстве медиан нельзя. Необходима постановка гипотез о стохастическом доминировании.

    10. В группах есть различие, где тезис об образовании: то есть согласие с тезисом о равенстве прав между мужчинами и женщинами различается в зависимости от уровня образования.

      Замечание: Это разница в выборке. Не достаточно свидетельств для того, чтобы предполагать, что в генеральной совокупности есть разница.

    11. Пост-хок анализ показывает, что все группы различаются друг от друга на статистическом значимом уровне с учетом поправки Бонферонни.

      Ошибка: Содержательная интерпретация должна быть скорректирована ввиду выше описанных ошибок

    12. Все группы различаются и все результаты получаются статистически значимы.

      Ошибка: Для теста Тьюки аналогично. Это можно заметить на графике. Только две пары не пересекают ноль.

    13. Средние всех групп различны.

      Ошибка: "Средние всех групп отличаются друг от друга." - средние не всех групп отличаются друг от друга. На 5% уровне отличаются группы Fairly bad - Fairly good, Very bad - Fairly good. На 10% уровне отличаются группы Very good - Very bad. Остальные группы статистически значимо не отличаются друг от друга.

    Annotators

    1. Все группы различаются.

      Ошибка: Различаются группы Have done - Might do, Would never. Группы Midght do и Would never не различаются.

    2. Нельзя утверждать, что медианное значение согласия с утверждением о пользе технологического прогресса различается от уровня образования.

      Почему? На 5% уровне есть различие между Lower-Higher. Т.е. люди, которые имеют высшее образование, выше оценивают значимость технологий, чем те кто имеют только начальное. Даже опираясь на медианы здесь видно, что у одних 8, а у других 7.

    3. Все группы отличаются. Все результаты статистически значимые.

      Ошибка: Аналогично заданию №1. Совсем не ясно, что это значит. Различия есть между большинством групп и группой Very interested (0.012, 0.007, 0.062). Для других заданий это тоже имеет смысл. Больше данный комментарий дублировать не буду.

    4. Нельзя утверждать, что присутствует связь между отношением к демократии и уровнем интереса к политике.

      Интерпретация здесь сложнее. Линейной связи нет. Однако респонденты "Very interested" в целом выше оценивают значимость демократии, чем все остальные группы. Между всеми остальными группами нет различий. Т.е. сильно отличается одна группа из всех.

    5. Все группы отличаются. Все результаты статистически значимые.

      Ошибка: Такая формулировка путает, ибо до этого вы пишите о достаточно значимой разницы. Все группы различаются в выборке, но маловероятно, что они различаются в генеральной совокупности. Для этого мы должны смотреть на доверительные интервалы и p-value. Статистически значимо (95%) отличается две группы. Остальные группы статистически значимо не различаются.

    Annotators

    1. Таким образом можно сказать, что значимость для респондента жить в демокративеской стране не зависит от заинтересованности политикой.

      Интерпретация здесь сложнее. Линейной связи нет. Однако респонденты "Very interested" в целом выше оценивают значимость демократии, чем все остальные группы. Между всеми остальными группами нет различий. Т.е. сильно отличается одна группа из всех.

    2. Все группы различаются, однако в вышеперечисленных трех парах разница существенно больше.

      Замечание: Нам скорее интересны статистически значимые различия. Во всех остальных случаях различия возможны, но доверительные интервалы слишком широки. Плюс тест Тьюки парамтерический. Здесь лучше использовать тест Дана (Dunn test).

    Annotators

    1. Формы распределений довольно разные.

      Замечание: Здесь в целом можно говорить о том, что формы распределений похожи. Поэтому в целом можно было бы говорить о медианах. Конечно наиболее общим вариантом является интерпретация в виде стохастического доминирования.

    2. 0.0617564 n

      Замечание: В целом на 10% уровне 1 группа различается с 3. Об этом можно упомянуть, ибо вырисовывается, что первая группа отличается от остальных. Тогда как другие схожи.

    Annotators

    1. Все группы различаются.

      Ошибка: Опять различается только две группы Might do - Have done (0.001), Would never do - Have done (0.001). Группа Would never do - Might do не различаются.

    2. Средние всех групп отличаются друг от друга.

      Ошибка: Статистически значимо различается только одна группа Lower - Higher (0.012), остальные группы статистически значимо не различаются.

    3. pairwise.t.test

      Ошибка: Если основной тест непараметрический, то и пост-хок анализ тоже должен быть непараметрическим.

    4. Нулевая гипотеза – медианы между группами равны. Альтернативная гипотеза – медианы между группами не равны.

      Ошибка: Опять же, если вы утверждаете, что распределения различаются, то необходимо ставить гипотезы о стохастическом доминировании.

    5. Пост-хок анализ показывает, что все группы различаются друг от друга на статистическом значимом уровне с учетом поправки Бонферонни.

      Ошибка: Не все группы различаются...

    6. Средние групп отличаются друг от друга.

      Ошибка: Вновь отличаются не все группы. Отличаются группы Very interested - Not at all interested (0.041) - 5%, Very interested - Somewhat interested (0.087) - 10%. Остальные группы статистически значимо не отличаются.

    7. Множественное сравнение средних

      Ошибка: Если основной анализ непараметрический, то пост-хок анализ тоже должен быть непараметрическим.

    8. Нулевая гипотеза – медианы между группами равны. Альтернативная гипотеза – медианы между группами не равны.

      Ошибка: Если распределения различаются, то необходимо формировать гипотезы о стохастическом доминировании.

    9. Пост-хок анализ показывает, что все группы различаются друг от друга на статистическом значимом уровне с учетом поправки Бонферонни.

      Ошибка: Содержательная интерпретация должна быть скорректирована тем, что не все группы различаются.

    10. Визуализируем результаты.

      Ошибка: Аналогично не все группы различаются. По графику видно, что только две группы не перекрывают 0.

    11. Средние всех групп отличаются друг от друга.

      "Средние всех групп отличаются друг от друга." - средние не всех групп отличаются друг от друга. На 5% уровне отличаются группы Fairly bad - Fairly good, Very bad - Fairly good. На 10% уровне отличаются группы Very good - Very bad. Остальные группы статистически значимо не отличаются друг от друга.

    Annotators

    1. Нулевая гипотеза: Средние значения эмансипативных ценностей одинаковы для всех уровней участия в мирных демонстрациях. Альтернативная гипотеза: По крайней мере, для одного уровня участия в мирных демонстрациях средние значения эмансипативных ценностей отличаются.

      Ошибка: гипотезы и тип теста

    2. В двух из трех групп (Q211 == “1” и Q211 == “3”) распределение значений RESEMAVAL не отличается от нормального ( p > 0.05 ).

      Замечание: Опять же отличия минимальны. Можно использовать ANOVA

    3. Pairwise comparisons using t tests with pooled SD

      Ошибка: Если используете основной непараметрический тест, то пост-хок анализ тоже должен быть непараметрическим.

    4. • Средние ранги значений Q250 (значимость жить в демократической стране) одинаковы для всех уровней Q199 (заинтересованности в политике). Альтернативная гипотеза ( H_1 ): • По крайней мере для одной группы Q199 средние ранги значимо отличаются.

      Ошибка: Неверная постановка гипотез

    5. Нулевая гипотеза: Средние значения согласия с равенством прав мужчин и женщин одинаковы для всех уровней образования. Альтернативная гипотеза: По крайней мере, для одного уровня образования средние значения согласия с равенством прав мужчин и женщин отличаются.

      Ошибка: Аналогично первому заданию неверная постановка гипотез.

    6. Нулевая гипотеза отклоняется, есть значимые различия между группами.

      Ошибка: Если есть отличия при дисперсионном анализе, то необходимо проводить пост-хок анализ. В самом простом варианте множественное параметрические/непараметрическое сравнение с поправкой. В данном случае не все группы различаются статистически значимо, а лишь некоторые.

    7. Нулевая гипотеза: Средние значения эмансипативных ценностей одинаковы для всех уровней согласия с демократическим режимом. Альтернативная гипотеза: По крайней мере, для одного уровня согласия с демократическим режимом средние значения эмансипативных ценностей отличаются.

      Ошибка: Если вы используете непараметрический тест, то постановка гипотез о средних не является верной. При непараметрическом тесте нужна постановка гипотез о равенстве медиан (при схожести распределений) или стохастическом доминировании (при отсутствии схожести распределений)

    8. мы не можем использовать параметрические методы анализа. Вместо этого мы будем применять непараметрический тест для проверки гипотез.

      Замечание: В данном случае отклонение от нормальности минимальное. Поэтому использовать ANOVA можно

    Annotators

    1. Оба графика показывают недостаточно чёткую визуальную картинку, однако можно судить о том, что действительно существует сильная положительная связь между значением индекса эмансипирвоанных ценностей и степенью одобрения эвтаназии.

      Комментарий: В данном случае было бы лучше перевернуть оси. Т.е. сделать RESEMAVAL по Y, а одобрение эвтаназии по X. Тогда можно было бы увидеть почти четкую линейную связь.

    2. Заметно, что связь не линейная – свойственно для порядковых переменных.

      Замечание: В целом, если вы увидите такую нелинейность на графиках двух интервальных переменных, то этим можно пренебречь в угоду удобности интерпретации корреляции Пирсона.

    Annotators

    1. correlation(wvs_7_russia_sec_sub, method = "spearman") %>% summary() %>% plot()

      Вероятно, что у данные переменные не распознались как numeric, а скорее всего записаны как character. Ввиду этого получился вот такой вот монстр...

    Annotators

    1. Более точная интерпретация: повышение уровня одобрения/оправдания насилия в отношении других людей на одно стандартное отклонение связано с повышением уровня одобрения/оправдания насилия мужчинами в отношении своих жен на 0.54.

      Замечание: Корреляция Спирмена/Кенделла не полагается именно на стандартное отклонение переменных, а полагается на стандартное отклонение рангов этих переменных. Большая часть непараметрических тестов конвертирует реальные данные в ранги. Т.е. если это самая большая величина, то это 1 или, и т.д. Подробное описание в википедии

    Annotators

    1. Визуалириуем пары, где мы можем отвергнуть нулевую гипотезу.

      Комментарий: Такой график не очень удачен. Лучше визуализировать вручную с помощью geom_jitter (как в задание №2)

    2. гипотизы

      Комментарий: Вы ошибаетесь, когда пишите гипотизы -- верное написание гипотеза. Не сочтите меня снобом, и т.д, просто немного режет глаза. Все же важное понятие для ученых...

    3. Связи являются статистически значимыми и положительными.

      Комментарий: Здесь можно добавить, что содержательно хотя индексы связаны друг с другом. Можно предполагать, что они измеряют разные части понимания секулярности-религиозности. Наверное, это очень хорошо...

    Annotators

    1. Чем менее демократичным (Fairly bad либо Very bad) российский респодент в 7 волне WVS считает свой политический режим, тем в среднем более высоким уровнем эмансипативных ценностей он обладает.

      Замечание: Это только частично верно. Действительно те, кто обладают более низкими уровнями отношения к демократии имеют статистически значимо более низкий уровень эмансипативных ценностей, но в сравнении с группой Fairly good. В сравнении с группой Very good статистически значимых различий нет.

    2. Как показали пост-хок тесты, статистически значимых различий НЕТ.

      Комментарий: Пост-хок тесты можно не проводить, если в самом дисперсионным анализе нет статистически значимых различий.

    Annotators

    1. Нельзя утверждать, что значение согласия с тезисом, что мир стал лучше благодаря технологиям различается в зависимости от уровня образования.

      Замечание: Почему? Есть различие между двумя группами (Высшее образование - Начальное образование). Нельзя утверждать, что значения тезиса различается между всеми группами, но различия есть. Да, они крайне маргинальны 0.046. Однако мы придерживаемся конвенционального уровня.

    2. Заинтересованность респондентов в политике, в среднем, не имеет влияния на желание жить в стране с демократическим режимом.

      Замечание: Люди, которые очень заинтересованы в политике, отличаются от всех остальных групп (от двух статистически значимо на конвенциональном уровне, на одной группе на 10%). Эти люди с большей вероятностью будут сильнее оценивать значимость важности для жизни в демократии. Между остальными группами различий нет.

    3. на 5% (и на 1% тоже) уровне значимости можно утверждать, что среднее значение уровня эмансипативных ценностей различается в зависимости от уровня согласия с тезисом демократическом режиме управления страной.

      Замечание: Точнее: действительно те, кто обладают более низкими уровнями отношения к демократии имеют статистически значимо более низкий уровень эмансипативных ценностей, но в сравнении с группой Fairly good. В сравнении с группой Very good статистически значимых различий нет.

    1. Среднее значения согласия с тезисом о гендерном правовом равенстве чуть выше (на 1 ед.)

      Замечание: Все же медианы

    2. Данные результаты показывают, что среди респондентов в России в 7-й волне Всемирного опроса о ценностях (WVS) существует тенденция: чем более негативно они относятся к демократии, тем выше уровень их эмансипативных ценностей.

      Замечание: Действительно те, кто обладают более низкими уровнями отношения к демократии имеют статистически значимо более низкий уровень эмансипативных ценностей, но в сравнении с группой Fairly good. В сравнении с группой Very good статистически значимых различий нет.

    Annotators

    1. Формы распределений похожи. Возможно формировать гипотезы о равенстве медиан.

      Ошибка: Аналогично заданию №3

    2. все группы различаются друг от друга на статистическом значимом

      Замечание: Утверждение о том, что все группы различаются подразумевает, что 1) Would never do отличается от Might do и Have done; 2) Might do отличается от Have done. В данном случае отличие есть только группы Have done от остальных. Статистически значимых различий между Might do и Would never do нет.

    3. Формы распределений достаточно похожи. Возможно формировать гипотезы о равенстве медиан.

      Ошибка: Я бы не сказал, что формы распределений похожи. Если еще somewhat, not very и not at all с натяжкой могут быть похожи, то very interested явно отличается от них. Лучше здесь поставить гипотезы о стохастическом доминировании.

    Annotators

    1. что группа Higher доминирует над группой Lower (или наоборот?)

      Вероятность, что взятое случайное наблюдение из группы higher > взятого случайного наблюдения lower, предполагает, что higher доминирует над lower. На графике это можно заметить рассмотрев распределение higher, где многие значения сгруппированы на 10.

    2. Нулевая гипотеза (H0) - медианы между группами равны. Альтернативная гипотеза (HA) - медианы между группами не равны.

      Замечание: Для формирования гипотез о равенстве медиан необходимо, что бы формы распределений были схожими. Иначе можно говорить только о гипотезах стохастического доминирования. В данном случае формы распределений различаются.

    3. Нулевая гипотеза (H0) - медианы между группами равны Альтернативная гипотеза (HA) - медианы между группами отличаются

      Замечание: Для формирования гипотез о равенстве медиан необходимо, что бы формы распределений были схожими. Иначе можно говорить только о гипотезах стохастического доминирования.

    Annotators

    1. RESEMAVAL_values %>% mutate(democratic_values = case_when(Q238 == 1 ~ "absolutely democratic", Q238 == 2 ~ "almost democratic", Q238 == 3 ~ "almost democratic", Q238 == 4 ~ "absolutely not democratic" ))

      Замечание: Не очень понимаю, а зачем было объединять категории? 2 и 3 категория были объединены в одну, но зачем? Если делаете такие действия, то описывайте логику, иначе не ясно.

    1. 0.0617564

      Замечания: Между группами Not very interested и Very interested различия есть на 10%. В целом различия наблюдаются почти между остальными группами и группой "Very interested".

    2. Медианное значение согласия с утверждением о равенстве прав мужчин и женщин может различаться от уровня образования, однако эти медианные значения между всеми группами все же достаточно близки

      Замечание: Это скорее наблюдаемые значения в выборке. У нас нет достаточных оснований для переноса этих выводов в гс.

    3. Можете предположить, что дисперсии в группах однородны.

      Замечание: Если быть достаточно строгим, то у порядковых переменных нет средних и дисперсий...

    4. Все результаты статистически значимы. Все группы различаются.

      Замечание: Все же не все группы различаются. Статистически значимые различия (т.е., с большой вероятностью имеющиеся не только в выборке, но в гс) есть между группами Fairly good - Fairly bad, Fairly good - Fairly bad. Различия между Very good - Very bad значимы только на 10%. (p-value 0.07). В таком случае лучше говорить о том, что различия есть между некоторыми группами. Например, группы Fairly bad - Very bad и группы Fairly good - Very good не различаются, т.е. не все группы отличаются друг от друга. Точнее было бы сказать, что те кто хорошо оценивают демократию и плохо различаются по уровню эмансипативных ценностей.

    Annotators

  2. Nov 2024
    1. Между уровнем образования и согласием с утверждением, что мужчины становятся лучшими политическими лидерами, нет статистически значимой ассоциации.

      Замечание: Более логичным, как мне кажется, рассматривать данные гипотезы как различие в распределениях.

    2. task_data5

      Замечание: Вы не верно обработали данные. У вас появился лишний уровень (-1), которого быть не должно. В данном случае это не критическая ошибка, но может стать критической в другом случае.

    3. Это означает, что существует статистически значимая зависимость между уровнем образования и согласием с утверждением о том, что мужчины становятся лучшими политическими лидерами. Иными словами, уровень образования респондента оказывает влияние на его мнение по этому вопросу.

      Ошибка: Необходима более подробная интерпретация (пост-хок анализ, описание какие группы значимо отличаются, и т.д.). Относится и ко всем остальным заданиям.

    Annotators

    1. Стоит отметить, что были объеденены значения 3 (Not very happy) и 4 (Not at all happy) в переменной Q46 в один уровень - Not happy

      Комментарий: Это не предполагалось, но это можно было сделать ввиду малых значений в одной из категорий.

    Annotators

    1. Нельзя утверждать, что существует статистически значимая зависимость между предпочтением свободы или равенства и полом Предпочтения свободы или равенства у мужчин и женщин достаточно близки.

      Комментарии: Отделяйте содержательную интерпретацию от технической, и т.д.

    2. Нулевая гипотеза: зависимость между полом и предпочтением свободы или равенства отсутствует Альтернативная гипотеза: существует зависимость между предпочтением свободы или равенства и полом

      Замечание: Все же лучше говорить об ассоциации, чем о зависимости. Это точнее.

    3. ```{.r .cell-code} wws_7_freedom_equality <- wvs_7_russia %>% select(Q149, Q260) %>% rename(freedom_equality = Q149, sex = Q260) %>% mutate( freedom_equality = if_else(freedom_equality == 1, "Freedom", "Equality"), sex = if_else(sex == 1, "Male", "Female") ) ``` :::

      Комментарии: Все сломалось...

    Annotators

    1. Пост-хок анализ

      Замечание: Я почти уверен, что post-hoc анализ можно не проводить, если результаты не являются статистически значимыми. Только при условии, что результаты статистически значимы какие-либо значения значимо отличаются от ожидаемых (их стандартный остаток больше 2).

    Annotators

    1. Принимаем альтернативную гипотезу о различиях в согласии с указанным утверждением между группами мужчин и женщин.

      Замечание: Нельзя принять альтернативную гипотезу (если быть очень кратким).

      Подробнее об этом: 1) https://math.stackexchange.com/questions/4185778/why-can-we-not-accept-the-alternate-hypothesis-in-chi-squared-testing (второй ответ) 2) https://stats.stackexchange.com/questions/587383/why-cant-we-accept-the-null-hypothesis-but-we-can-accept-the-alternative-hypot (множество размышлений здесь)

      Данное замечание относится и ко всем остальным тезисам о принятии альтернативной гипотезы.

    Annotators

    1. Мужчины значительно чаще (27% против 17) категорически соглашаются с тезисом о том, что мужчины становятся лучшими политиками.

      Комментарий: Выходите на более абстрактные выводы в отдельной содержательной интерпретации

    2. уровень чувства счастья не отличается между верующими и неверующими.

      Комментарий:Точнее сказать, что распределение уровня счастья не различается между верующими и неверующими

    Annotators

    1. Среди неверующих людей чуть больше доля тех, кто чувствует себя несчастным (не совсем счастливым или совсем несчастным). Однако нельзя утверждать, что существует статистическая значимая ассоциация между религиозностью и чувством счастья.

      Замечание: Старайтесь давать более структурированные ответы. Используйте подзаголовки и явным образом отделяйте содержательную интерпретацию, описание визуализации, и т.д. (относится и ко всем остальным заданиям)

    Annotators

    1. Post hoc анализ

      Комментарий: Я почти уверен, что post-hoc анализ можно не проводить, если результаты не являются статистически значимыми. Только при условии, что результаты статистически значимы какие-либо значения значимо отличаются от ожидаемых (их стандартный остаток больше 2).

    2. Статистическую разницу в распределении мнений о доверии среди всех уровней образования chi-test определяет как несущественую.

      Комментарий: В итоговых результатах можно сослаться на уровень значимости. Достаточно часто 90-ый уровень применяется. В таком случае, при 90-отном уровне можно утверждать об ассоциации. В случае 95-отном уровне утверждать об ассоциации нельзя.

    Annotators

    1. В последней волне всемирного обзора ценностей средняя величина удовлетворённости жизнью равна 6,5.

      Замечание: В задании речь шла о медиане, поэтому стоит дальше говорить о сравнении медиан, а не средних.

    2. * Нулевая гипотеза (H0) – среднее выборки не отличается от среднего генеральной совокупности * Альтернативная гипотеза (H1) – среднее выборки отличается от среднего генеральной совокупности *

      Ошибка: Гипотезы для непараметрического теста иные. Все же речь идет о медиане.

    3. Нулевая гипотеза (H0) – среднее значение возраста для групп готовых доверять и не готовых доверять не отличается Альтернативная гипотеза (H1) – среднее значение возраста для групп готовых доверять и не готовых доверять отличается

      Ошибка: Гипотезы для непараметрического теста иные.

    4. Нулевая гипотеза (H0) – среднее значение согласия с утверждением между группами верующих и неверующих не отличается Альтернативная гипотеза (H1) – среднее значение согласия с утверждением между группами верующих и неверующих отличается

      Ошибка: Гипотезы для непараметрического теста иные.

    5. Нулевая гипотеза (H0) – среднее значение уровня значимости равенства для мужчин и женщин не отличается Альтернативная гипотеза (H1) – среднее значение уровня значимости равенства для мужчин и женщин отличается

      Ошибка: Гипотезы поставлены для параметрического теста. Следует либо написано два типа гипотез, если используете два теста. Только гипотезы для необходимого теста.

    Annotators

    1. ggbetweenstats

      Замечание: Здесь нужно поменять тип теста на непараметрический - 'type = "nonparametric"'. Относится и к другим заданиям, где используется визуализация

    2. Люди, которые не верят в бога, имеют более высокий уровень эмансипативных ценностей, чем верующие люди.

      Комментарий: Старайтесь давать более четкие выводы, насколько сильно различаются, и т.д. Относится ко всем остальным заданиям.

    3. По графикам тоже видно, что распределение не соответствует нормальному, поэтому будем использовать непараметрические критерии, Манна-Уитни, в частности.

      Ошибка: Отсутствует явная постановка гипотез

    4. По графикам видно, что распределение приближено к нормальному, поэтому мы можем использовать параметрический тест Стьюдента.

      Ошибка: Отсутствует явная постановка гипотез

    5. По графикам тоже видно, что распределение не приближено к нормальному, поэтому мы не можем использовать параметрический тест Стьюдента и будем использовать Манна-Уитни.

      Ошибка: Отсутствует явная постановка гипотез

    Annotators

    1. В последней волне всемирного обзора ценностей средняя величина удовлетворённости жизнью равна 6.55

      Предполагалось, что здесь должна быть медиана.

    2. mutate(DEMOCRACY = na_if(DEMOCRACY, 0))

      Замечание: Вы здесь допустили ошибку, заменим все 0 NA. Из-за этого у Вас изменились распределения.

    Annotators

    1. Медианная поддержка тезиса “Религиозные власти интерпретируют законы” теми, кто не верит в Бога, в среднем ниже медианой поддержки тезиса теми, кто верит в Бога (выборочные значения: 3.18 против 3.89).

      Замечание: Опять же здесь отображены средние, а не медианы.

    2. Медианный уровень индекса ценностей равенства у женщин выше, чем у мужчин (выборочные значения: 0.54 против 0.46).

      Замечание: Ввиду неверного аргумента на картинке отображены не медианы, а средние.

    3. parametric

      Замечание: Здесь необходимо поставить другой тип аргумента - "nonparametric", если Вы решили использовать тест wilcox.test

    4. Визуализации показывают, что значительная часть значений лежат вдоль или около ожидаемых квантилей. В целом, данные распределены достаточно нормально с допустимыми отлонениями. Использую непараметрический тест.

      Замечание: Вам не кажется, что здесь описана странная логика? Если значительная часть значений лежат вдоль или около ожидаемых квантилей, то зачем использовать непараметрический тест?..

    Annotators

    1. Данные распределены ненормально, проводим непараметрический тест Манна-Уитни

      Комментарий: Здесь можно было воспользоваться t-test. В целом такое отклонение не является значительным. Использовать непараметрический аналог также возможно.

    Annotators

    1. Нулевая гипотеза (H0) – данные не отличаются. Альтернативная гипотеза (HA) – данные отличаются. Используем конвенциональный уровень значимости – 0.05 (α=0.05)

      Ошибка: Неверно поставлены гипотезы

    2. Разница есть. Средний возраст людей с высоким уровнем доверия составляет примерно 44,11, тогда как средний возраст людей с низким уровнем доверия составляет 45,88. Группа с высоким уровнем доверия моложе группы с низким уровнем доверия. Результаты показывают, что более высокий уровень доверия к другим связан с молодостью.

      Ошибка: Неверно выбран тест, поэтому содержательная интерпретация не является точной.

    3. Нулевая гипотеза (H0) – данные не отличаются. Альтернативная гипотеза (HA) – данные отличаются. Используем конвенциональный уровень значимости – 0.05 (α=0.05)

      Ошибка: Неверная постановка гипотез.

    4. Поддерживающих больше, чем не поддерживающих. Религиозные предпочтения существенно влияют на то, как люди воспринимают роль религиозных авторитетов в толковании законов. Верующие склонны проявлять большую поддержку этого тезиса, чем неверующие.

      Замечание: Из-за неверно выбранного теста содержательная интерпретация не является точной.

    5. t-test, для сравнения поддержки тезиса двумя группами
      • Ошибка: Отсутствие проверки допущений
      • Ошибка: Неверный выбор теста
    6. Нулевая гипотеза (H0) – данные не отличаются. Альтернативная гипотеза (HA) – данные отличаются.

      Ошибка: Неверная постановка гипотез. Аналогично заданию №1, №2.

    7. Вера в Бога связана с низким уровнем эмансипативных ценностей.

      Замечание: Из такого утверждения складывается ощущение о том, что верующие имеют значительно более низкий уровень эмансипативных ценностей. В действительности между ними есть статистически значимая разница, но она не так критична. 0.39 против 0.43 в выборочных значениях. При самом "максимальном" сценарии разница в среднем составляет около 0.055 значений.

      Более точной формулировкой было бы: "Вера в Бога в среднем связана с более низким уровнем эмансипативных ценностей"

    8. Разница существует. Неверующие получают более высокие показатели по шкале эмансипативных ценностей.

      Замечание: Замечание аналогичное заданию №1. Больше конкретики.

    9. t-test для сравнения сходных значений между верующими и неверующими

      Ошибка: Отсутствует проверка допущений.

    10. Нулевая гипотеза (H0) – данные не отличаются. Альтернативная гипотеза (HA) – данные отличаются.

      Ошибка: Аналогично заданию №1. Такая постановка гипотез является слишком широкой. Для различных статистических тестов есть собственные гипотезы.

    11. Разница есть. Женщины имеют более высокие показатели EQUALITY, чем мужчины.

      Замечание: Будьте более конкретными. Разница есть, но насколько? Поймите, что статистически значимая разница возможна как между 0.05 и 0.06, так и между 0.05 и 0.6. Важно конкретизировать насколько велика разница. Таким образом, насколько женщины имеют более высокие показатели равенства, чем мужчины?

    12. Нулевая гипотеза (H0) – данные не отличаются. Альтернативная гипотеза (HA) – данные отличаются.

      Ошибка: Такая постановка гипотез является слишком широкой. Для различных статистических тестов есть собственные гипотезы.

    Annotators

    1. На 5-ти % уровне значимости мы можем утверждать, что средние значения ответов респондентов текущей волны всемирного обзора ценностей в России отличаются от предыдущей волны всемирного обзора ценностей

      Замечание: Здесь необходимо указывать не среднее, а медиану. Как задание, так и тест все же полагается на нее.

    2. Нулевая гипотеза (H0) – среднее выборки не отличается от среднего генеральной совокупности Альтернативная гипотеза (HA) – среднее выборки отличается от среднего генеральной совокупности

      Ошибка: Необходима постановка других гипотез.

    3. (95%-доверительный интервал)

      Для непараметрических тестов доверительный интервал более сложная концепция, чем для параметрических. О доверительных интервалах (2) для данного теста: 1) https://stats.stackexchange.com/questions/404971/wilcoxon-signed-rank-test-help-on-interpretation-of-pseudo-median ; 2) https://stats.stackexchange.com/questions/612172/why-is-the-pseudomedian-better-than-the-median-in-a-wilcoxon-test

    4. Нулевая гипотеза (H0) – среднее значение возраста среди людей, которые обладают высоким уровнем доверия к остальным и низким не различается Альтернативная гипотеза (HA) – среднее значение возраста среди людей, которые обладают высоким уровнем доверия к остальным и низким различается

      Ошибка: Как и для 3 задания гипотезы поставлены неверно.

    5. Нулевая гипотеза (H0) – среднее значение поддержки тезиса между группами верующих и не верующих в бога не различается Альтернативная гипотеза (HA) – среднее значение поддержки тезиса между группами верующих и не верующих в бога различается

      Ошибка: Вы ниже верно определяете, что нужен непараметрический аналог теста, но тогда и гипотезы нужны не о равенстве/различии средних, а о медианах.

    6. Большая часть значений лежат вдоль ожидаемых квантилей. t-test в целом является достаточно устойчивым при небольшом отклонении от нормального распределения.

      Замечание: Я бы, скорее, сказал, что в данном случае лучше использовать непараметрический аналог. Вопрос робастности достаточно сложный и понять когда можно пренебречь непросто. В моем представлении здесь лучше было бы воспользоваться непараметрическим аналогом. Ввиду того, что на концах распределений значения явно отклоняются от ожидаемых. Плюс многие значения достаточно часто выходят за доверительный интервал.

    Annotators

    1. В среднем, те кто не доверяет людям старше, чем те, кто доверяет. Но возраст не сильно отличается (44 и 42).

      Ошибка: Здесь не хватает явной содержательной интерпретации.

    2. В последней волне всемирного обзора ценностей средняя величина удовлетворенности жизнью равна 6.55

      Замечание: Здесь необходимо указывать не среднее, а медиану. Как задание, так и тест все же полагается на нее.

    3. Видим, что поддержка тезиса “Религиозные власти интерпретируют законы” (Q242) различается в зависимости от веры или не веры в бога. Верующие люди имеют показатель выше.

      Ошибка: Не хватает содержательной интерпретации.

    4. Неверующие в среднем имеют чуть более высокие значения индекса эмансипативных ценностей (выборочные значений:0.39 против 0.43)

      Ошибка: Отсутствует содержательная интерпретация для результатов.

    5. Действие №3. Проводим тест. p-value меньше 0.05, отвергаем нулевую гепотизу о равенстве средних.

      Ошибка: Отсутствуют гипотезы для t-test

    6. Выводы по t-test: p-value < 0,05, значит отвергаяем нулевую гепотизу о равенстве среднего у двух полов, разница находиться в пределах между -0.102 и -0.063

      Ошибка: 1) Отсутствуют гипотезы для t-test; 2) Нет визуализации; 3) Нет содержательной интерпретации

    7. При определении допущений было доказано, что данные имеют нормальное распределение, можно проводить t-test.

      Я бы, скорее, сказал, что в данном случае лучше использовать непараметрический аналог. Вопрос робастности достаточно сложный и понять когда можно пренебречь непросто. В моем представлении здесь лучше было бы воспользоваться непараметрическим аналогом. Ввиду того, что на концах распределений значения явно отклоняются от ожидаемых. Плюс многие значения достаточно часто выходят за доверительный интервал.

    Annotators

    1. p-value < 0,05 и p-value <0,01. Соответственно, мы отвергаем нулевую гипотезу, тк в исследуемой выборке уровень удовлетворенности жизнью значительно отличается от 6. В данном случае медиана равно 7.

      Ошибка: не хватает графика и содержательной интерпретации.

    2. В выборке различие между группами составляет -2.10. В генеральной совокупности различие между двумя группами находится в интервале от [-3.92,-0.15] при 95% доверительном интервале -Возраст людей, которые не доверяют другим, в среднем выше, чем у тех, кто доверяет

      Аналогично заданию №3 здесь проблема связана с тем, что здесь среднее, а не медиана. Плюс сложность с доверительным интервалом.

    3. Нулевая гипотеза: статистически значимого отличия в возрасте между теми, кто обладает высоким уровнем доверием к остальныи, и теми, кто обладает низким, нет. Альтернативная гипотеза: присутствует статистически значимое отличие в возрасте между теми, кто обладает высоким уровнем доверием к остальныи, и теми, кто обладает низким

      Ошибка: Неверна определена нулевая гипотеза

    4. В выборке различие между двумя группами составляет 0.07. В генеральной совокупности различие между двумя группами находится в интервали от |0.31| до |1.10| при доверительном интервале 95%

      Для теста Вилкоксона доверительный интервал является более сложной концепцией, чем для параметрического t-test. Здесь Вы вычисляете разницу между средними (1) 3.89-3.18 = 0.71, что не верно о чем я написал выше. Это не упоминалось на паре, поэтому за ошибку это считаться не будет. О доверительных интервалах (2) для данного теста: 1) https://stats.stackexchange.com/questions/404971/wilcoxon-signed-rank-test-help-on-interpretation-of-pseudo-median ; 2) https://stats.stackexchange.com/questions/612172/why-is-the-pseudomedian-better-than-the-median-in-a-wilcoxon-test

    5. parametric

      Замечание: Здесь необходимо поменять на "nonparametric", тогда график будет отображен как непараметрический.

    6. Поскольку P-value<0,05, следовательно мы отклоням нулевую гипотезу об отсутствии связи.На 95% доверительном интервале мы можем говорить о наличии статистически значимой связи между двумя переменными.

      Замечание: Ввиду неверной гипотезы получается неверный вывод.

    7. Нулевая гипотеза: поддержка тезиса “Религиозные власти интерпретируют законы” не отличается между группой, которая верит в бога, и группой, которая не верит в бога. Альтернативная гипотеза: поддерка тезиса “Религиозные власти интерпретируют законы” отличается в группе, которая не верит в бога, от группы, которая верит в бога

      Ошибка: Неверна определена нулевая гипотеза

    8. t говорит о то, что разница между средними переменной “уровень ценностей равенства” у мужчин и женщин различается на 8.

      Не очень понятно, что это значит. С одной стороны я могу понять, что это можно проинтерпретировать как верно суждение, с другой стороны оно очень сложное. t-статистика (t-value) -- это разница между средними выборок деленное на совместную дисперсию.

    9. Графики также говорят о том, что распределение нормальное. Следовательно, можно приступать к т-тесту.

      Замечание: Я бы, скорее, сказал, что в данном случае лучше использовать непараметрический аналог. Вопрос робастности достаточно сложный и понять когда можно пренебречь непросто. В моем представлении здесь лучше было бы воспользоваться непараметрическим аналогом. Ввиду того, что на концах распределений значения явно отклоняются от ожидаемых. Плюс многие значения достаточно часто выходят за доверительный интервал.

    Annotators

    1. В последней волне всемирного обзора ценностей медиана уровня удовлетворенности жизни равна 6.55.

      Замечание: Это не медиана, а среднее. Опять же среднее отображается ввиду того, что не вы указали необходимый тип теста.

    2. В выборке различие между двумя группа составляет 2.03. В генеральной совокупности различие между двумя группами находится в интервале от 0.12 до 3.9 (95%-доверительный интервал).

      Аналогично заданию №3 здесь проблема связана с тем, что здесь среднее, а не медиана. Плюс сложность с доверительным интервалом.

    3. Доверие прослеживается у всех возрастов чаще, чем недоверие.

      Замечание: Не очень понимаю, что это значит.

    4. task_1_fear <- filter(task_1_data, fear_or_trust == "Trust") task_1_trust <- filter(task_1_data, fear_or_trust == "Fear")

      Замечание: Долго не мог понять в чем дело. Старайтесь не допускать ошибок, где все встает с ног на голову. Fear стало Trust, а Trust стало Fear.

    5. Так как p-значение (0.02551) меньше 0.05, можно сделать вывод о том, что есть статистически значимая разница между двумя группами (в данном случае, между значениями Q262, разделенными по переменной fear_or_trust).

      Замечание: В будущих работах эксплицитно прописывайте уровень значимости на который вы ориентируетесь.

    6. Нулевая гипотеза утверждает, что не существует статистически значимых различий в возрасте между людьми с высоким уровнем доверия и людьми с низким уровнем доверия.

      Ошибка: Аналогично заданию 3, нулевая и альтернативная гипотезы неверны.

    7. В выборке различие между двумя группами составляет - 0,70. В генеральной совокупности различие между двумя группами находится в интервале от - 1.8 до -0.32 (95%-доверительный интервал).

      Замечание: Для теста Вилкоксона доверительный интервал является более сложной концепцией, чем для параметрического t-test. Здесь Вы вычисляете разницу между средними (1) 3.89-3.18 = 0.71, что не верно о чем я написал выше. Это не упоминалось на паре, поэтому за ошибку это считаться не будет. О доверительных интервалах (2) для данного теста: 1) https://stats.stackexchange.com/questions/404971/wilcoxon-signed-rank-test-help-on-interpretation-of-pseudo-median ; 2) https://stats.stackexchange.com/questions/612172/why-is-the-pseudomedian-better-than-the-median-in-a-wilcoxon-test

    8. type = "parametric"

      Замечание: Если вы используете непараметрический тест, то и для картинки используйте непараметрический. Здесь необходимо указать "nonparametric".

    9. Таким образом, можно отвергнуть нулевую гипотезу о равенстве местоположения и принять альтернативную гипотезу о том, что между группами есть значимое различие.

      Замечание: Это технически верно, но чаще говорят о равенстве/различие медиан.

    10. Поддержка тезиса “Религиозные власти интерпретируют законы” одинакова независимо от религиозных предпочтений респондента.

      Ошибка: Неверна определена нулевая гипотеза

    11. Такое небольшое отличие от нормальности в целом может является критическим для устойчивости результата теста, поэтому попробуем провести тест Вилкоксона

      Замечание: Дополнительно к этому данная переменная (Q242) не является интервальной. Она является порядковой. В таком случае известно, что 2 > 1, но неизвестно насколько (аналогично и для других значений). У порядковых переменных (если быть "пуристами") нет среднего значения, дисперсии, и т.д.

    12. Следуя графику qq-плот, видим, что отличия в группах не сильно отличаются от ожидаемых. Такое отличие от нормальности в целом может не являться критическим для устойчивости результата теста.

      Замечание: Здесь полностью согласен. Очень мало значений отличаются от ожидаемых.

    13. В выборке различие между двумя группами составляет 0,08. В генеральной совокупности различие между двумя группами находится в интервале от 0.06 до 0.1 (95%-доверительный интервал).

      Замечание: используйте заголовки различных уровней (### можно такой) для более удобной навигации.

    14. Такое небольшое отличие от нормальности в целом не является критическим для устойчивости результата теста.

      Замечание: Я бы, скорее, сказал, что в данном случае лучше использовать непараметрический аналог. Вопрос робастности достаточно сложный и понять когда можно пренебречь непросто. В моем представлении здесь лучше было бы воспользоваться непараметрическим аналогом. Ввиду того, что на концах распределений значения явно отклоняются от ожидаемых. Плюс многие значения достаточно часто выходят за доверительный интервал.

    Annotators