Whole document tree
    

Whole document tree

分析ツール

Chapter 7. 分析ツール

7.1. データ分析ツール

データ分析ツールパッケージには、統計データ分析、乱数生成、データサンプリングのさまざまなツールが含まれています。これらのツールを使うには、``Tools''メニューの中の``Data Analisis...''を選びます。すると選択できるツールのリストが開きます。そのリストから一つを選んで、OKボタンを押してください。ツールは以下で紹介します。

全てのツールには共通な出力オプションがあります。分析結果は、新しいシート、新しいワークブック、分析データの入っている同じシートに出力することができます。出力方法を選択するには、``Output options:''ラベルの下のラジオボタンの中の一つを選ぶだけです。出力範囲が小さすぎると、解析結果が収まりきれない場合があることに注意してください。出力範囲に入っていた古いデータが消えてしまうことにも注意してください。

7.1.2. 相関分析ツール

相関分析ツールは、指定された変数の相関係数を計算します。このツールを使えば、同時にいくつもの相関係数が計算できます。相関分析の対象となる変数は、``Input Range:''エントリで指定します。指定された範囲は、行か列でグループ化されます。

例えば、列 A と列 B の 2 変数の相関を計算するとします。両変数とも 1 行目から 10 行目までの 10 個の値を持つとします。はじめに、``Input Range:''エントリに A1:B10 を指定します。次に、``Groupped By:''ラベルに続く``Columns''ラジオボタンを選択します。そして出力オプションを指定し、OK ボタンを押します。

第 1 行に変数名のようなラベルがついている場合には、``Labels''ボタンをチェックしてください。 第 1 行(列でグループ化されている場合には第 1 列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。

結果は、各行・列に対応する変数名でラベルをつけられたテーブルに出力されます。出力範囲に名前がない場合、Gnumeric が作成します。算出された相関係数は、表形式で与えられます。例えば、前出の例、つまり列 A と列 B の変数の相関については、結果テーブルの 2 列目の 3 行目から読み取れます。(``Column 1''とラベルがつけられた列の、``Column 2''とラベルが付けられた行の中にあります。)

7.1.3. 共分散分析ツール

共分散ツールは、指定された変数の共分散を計算します。このツールを使うと、同時にいくつもの共分散が計算できます。共分散を計算する変数は、``Input Range:'' エントリで指定します。指定された範囲は行か列でグループ化されます。

例えば、列 A と列 B の2変数の共分散を計算したいとします。両変数とも 1 行目から 10 行目までの 10 個の値を持っているとします。はじめに、``Input Range:''エントリに A1:B10 を指定します。次に、``Groupped By:''ラベルの次にある、``Columns''ラジオボタンを選びます。それから、出力オプションを指定し、OK ボタンを押します。

第 1 行に変数名のようなラベルがついている場合には、``Labels''ボタンをチェックしてください。 第 1 行(列でグループ化されている場合には第 1 列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。

結果は、各行・列に対応する変数名でラベルをつけられたテーブルに出力されます。出力範囲に名前がない場合、Gnumeric が作成します。算出された共分散は、表形式で与えられます。例えば、前出の例、つまり列 A と列 B の変数の共分散は、結果テーブルの 2 列目の 3 行目から読み取れます。(``Column 1''とラベルがつけられた列の、``Column 2''とラベルが付けられた行の中にあります。)

7.1.4. 記述統計ツール

記述統計ツールは、指定された変数の統計情報を計算します。このツールを使えば、同時にいくつもの変数の一般的な統計量、平均値の信頼水準が計算できます。統計分析の対象となる変数は、``Input Range:''エントリで指定されます。指定された範囲は、行または列でグループ化されます。

このツールは、4 種類の異なる統計データを算出します。``Summary Statistics''ボタンがチェックされていると、基本統計量が計算できます。 平均値, 標準誤差, 中央値(メディアン), 最頻値(モード), 標準偏差, 標本分散, 劣度, 歪度, 範囲, 最小値, 最大値, 合計, カウント数が計算できます。

``Confidence Level for Mean''ボタンがチェックされている場合、各変数の平均の信頼水準を計算します。信頼水準を表すパーセントを指定しなければなりません。デフォルトの信頼水準は 95 %です。

``Kth Largest:'' ボタンがチェックされている場合、k 番目に大きい値を探し出します。チェックボタンの次にあるエントリボックスに k を指定して OK ボタンを押して下さい。

``Kth Smallest:'' ボタンがチェックされている場合、k 番目に小さい値を探し出します。チェックボタンの次にあるエントリボックスに k を指定して OK ボタンを押してください。

例えば第一行に変数名のようなラベルがついている場合には、``Labels'' ボタンをチェックしてください。 第一行(列でグループ化されている場合には第一列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。

7.1.6. 乱数生成ツール

このツールを使うと乱数が生成できます。様々な分布をもつ乱数が生成できます。

このツールを使うには、はじめに``Number of Variables:''エントリボックスに変数の数を指定します。この値により、乱数の列数が決まります。次に、生成する乱数の数を指定します。この値により、乱数の行数が決まります。そして、分布リストから一つ選択して、分布を指定します。 サポートされている分布は、離散分布、正規分布、ベルヌーイ分布、一様分布です。最後に、分布のパラメーターを指定します。