ロジスティック回帰分析における多重共線性の評価に関して|薬剤師のためのebmお悩み相談所-基礎から実践まで. 多重共線性.

多重共線性の意味について 重回帰分析などの多重共線性の目安として、説明変数の相関係数が0.95 とか、VIF (Variance Inflation Factor)の値が10 以上ということが言われているが、多重共線性は 数学的な問題だけでなく、実用上どこが問題となるのか考えてみる。 基本的に重回帰分析での話がベースです。 1. 多重共線性とは。 説明変数同士が強く相関してしまっているケースで発生する問題の事です。 例えば以下の様なモデルを推定したいとします。 y = a + b*x_1 + … 回帰での多重共線性とは、モデル内の一部の予測変数が他の予測変数と相関しているときに起こる状態です。重度の多重共線性は、回帰係数の分散を増加させて不安定にするため問題となります。係数が不安定になると次のような影響が生じます。 重回帰分析を行っている際、説明変数を増やすほど決定係数が高くなりやすいため、ついついよりたくさんの説明変数を入れてしまいがちです。しかし、その際に気をつけなければならないことがあります。それが多重共線性です。 とりあえず、ダミー変数の内1つは削除しとくのと、各説明変数毎に相関取ってみて0.9とかだとあやしいよね、くらいと説明されている。 ロジスティック回帰分析にも多重共線性の 問題が存在する 回帰式に, 相関の高い変数を組み合わせてい れたときに, 回帰式が変な値をとる場合が存 在する →確認手段として, 相関係数がr >.90となるよ うな相関の高い変数の組み合わせが存在す るかがある リッジ回帰の記事でも書こうと思って、キーワード検索で「リッジ回帰」と打ち込んでみたら、「リッジ回帰 多重共線性」という検索候補が出て来たのでちょっとかいてみることにしました。多重共線性記事について書いていたところだったので、丁度いいですね。 重回帰分析の課題.

前回から2回にわたって重回帰分析の課題をご紹介しています。 前回の「重回帰分析の課題~過剰適合~」では、要因系データの種類を増やした場合に見せかけの予測精度が向上してしまう「過剰適合」について説明しました。 今回は「多重共線性」についてです。 共通の性質を持つ説明変数が存在すると回帰式が不安定になることがあり、これを多重共線性というそうですが、重回帰分析と同様にvifを計算することもあれば[1]、ロジスティック回帰分析ではvifは不適合とされることもあるようです[2]。 多重共線性は、居酒屋率と中学校数という二つの説明変数が同じことを説明していないかを確認するためのものです。 これは糖分濃度を固定したときの居酒屋率と中学校数の偏相関分析によって求めること …