Интерпретация нормального вероятностного графика [закрыто]
У меня есть очень простой вопрос. Что лежит в основе нормального вероятностного графика, т. е. Что представляют собой вероятности? Я тестирую стандартное нормальное распределение. Мой normplot (в MATLAB) показал, что значения были более или менее прямыми, но вероятность 0,5 соответствовала значению, отличному от нуля.
Мой вопрос в том, как я это интерпретирую? Означает ли это, что мои данные распределены нормально, но имеют ненулевое среднее (т. е. не стандартное нормальное значение) или эта вероятность отражает только что-то другое? Я попробовал Google, и одна ссылка сказала, что вероятности-это совокупные вероятности из z-таблицы, и я не могу понять, что с этим делать.
Также в MATLAB, если значения вписываются в линию, проведенную программой (Красная пунктирная линия), значения поступают из нормального распределения? На одном из моих графиков пунктирная линия очень крутая, но значения вписываются, означает ли это, что одно или два значения, которые являются далеко за этой чертой находятся просто выбросы?
Я очень новичок в статистике, поэтому, пожалуйста, помогите!
Спасибо!


2 ответов:
Мой вопрос в том, как мне это интерпретировать? Означает ли это, что мои данные распределены нормально, но имеют ненулевое среднее (т. е. не стандартное нормальное) или эта вероятность отражает только что-то другое?Вы правы. Если вы запускаете normplot и получаете данные очень близко к установленной линии, это означает, что ваши данные имеют кумулятивную функцию распределения, которая очень близка к нормальному распределению. Точка 0,5 CDF соответствует среднему значению установленной нормали. распределение. (В вашем случае это примерно 0,002)
Причина, по которой вы получаете прямую линию, заключается в том, что ось y нелинейна, и она "искривлена" таким образом, что идеальное гауссовское кумулятивное распределение отображалось бы в линию: метки оси y линейны с обратной функцией ошибки .Когда вы смотрите на концы, и они имеют более крутые наклоны, чем подогнанная линия, это означает, что ваше распределение имеет более короткие хвосты, чем нормальное распределение, т. е. меньше выбросов, возможно, из-за какого-то физического ограничения, которое предотвращает чрезмерное отклонение от среднего.
Нормальное распределение - это функция плотности. Вероятность любого единичного значения будет равна 0. Это потому, что у вас есть общая вероятность ( = 1), распределенная между бесконечным числом значений (его непрерывная функция).
На графике (нормального распределения) показано, как распределяется вероятность (ось y) вокруг значений (ось x). Поэтому то, что вы можете получить из графика, - это вероятность интервала либо между 2 точками, от-бесконечного до любого точка, или от любой точки до +Infinite. Эта вероятность получается интегрированием функции (нормального распределения), определенной от точки 1 до точки 2.
Но вам не нужно делать этот Интеграл, так как у вас есть таблица Z. Таблица z дает вам вероятность того, что x находится между-бесконечным и x (применяя уравнение, связывающее x с z)
У меня здесь нет matlab, но я предполагаю, что прямая линия, которую вы упомянули, является функцией кумулятивного распределения, которая говорит вам о вероятности x между [- бесконечным, x], и определяется суммой (или интегралом в этом случае) от-бесконечного до значения x (или полученного в таблице z)
Извините, если мой английский был плохим. Надеюсь, я был полезен.
Comments