統計で使うBox-Cox変換というのがあります.データの値を として,Box-Cox変換は
で定義されます.ここで,はパラメタで,この値をうまく調整してやると,正規分布に従わないデータ
を,正規分布に従うデータ
に変換できちゃうことがあります.
何でこの変換でうまくいくの? という疑問に答えている説明を,統計の教科書で見たことはありませんが,一つの説明をここではします.ポイントは,
自然界には,「足し算」と「かけ算」の間にある演算が存在するから
ということです.例えるなら,「足し算」と「かけ算」を異なる2点としたとき,その2点を結ぶ直線上にある任意の点に対応する演算が存在するということです.
皆さんは,中心極限定理をご存じでしょうか.中心極限定理は,「ランダムな値をとる変数をたくさん足すと,足された値は正規分布に従うようになる」というやつです.
また,世の中には対数正規分布に従う変数もたくさんあります.対数正規分布に従う変数は,対数変換すると,正規分布に従うようになります.対数正規分布が登場する理由は,「ランダムな値をとる変数をたくさんかけてある」ということです.
対数変換は,Box-Cox変換では の場合に対応します.
の場合はどうなの? というのが問題ですが,これは,かけ算と足し算をつないでその間を埋める演算が,自然界に存在すれば,説明できます.以下では,かけ算でも,足し算でもなく,その間にある演算を「ヘンテコ算」と呼ぶことにします.
対数正規分布の場合,たくさんのかけ算を,足し算に変換する演算が,対数変換でした.
一般に,たくさんのヘンテコ算(かけ算と足し算の間)を,足し算に変換する演算が,q対数変換です.