[概要]
機関,個人を問わず投資家が証券取引において利益を生み出すためには,現在の経営状態から企業の行く末を正しく予測することが重要である.その取り組みの代表として考えられるのは,企業の倒産予測である.企業の倒産予測に関しては,パターン認識や機械学習といった統計的解析を用いてこれまでに多くの研究が報告されている.
倒産予測に関する研究の重要な構成要素は,分析に用いる財務指標の選択と予測モデルの構築である.これらは,機械学習における特徴量選択と識別関数の導出にそれぞれ対応する.従来の多くの倒産予測研究は,会計的な視点やそれまでの研究実績に基づいて財務指標をトップダウンに設定し,提案する予測モデルの予測精度の評価に焦点を当てていた.これらの研究では,設定される財務指標と予測モデルの相性が良好となるとは限らない.一方で,財務指標の選択方法に焦点を当て,決定木などの統計的手法を用いる研究も報告されている.これらの研究の多くは,選択された指標に対して後段で線形判別分析などの識別器を適用する.したがって,指標選択と予測モデルの構築が別々のプロセスとなるため,選択される指標と予測モデルの相性が良好である保証はない.
以上の背景の下に本研究では,倒産予測において,財務指標の選出から予測モデルの構築までを単一の枠組みの中で扱うことを目的とする.我々はこれまでに,機械学習の分野において,特徴量選択の目的で使われることがある
AdaBoost に注目した方法を提案している.本論文では,その発展形であるReal AdaBoostアルゴリズムを利用して精度の改善を目指す.Real
AdaBoostは,逐次的に指標を選択するが,前のステップで選ばれた指標が誤識別する学習サンプルの重みを後段のステップでは増加させる.この特徴のために,後段のステップでは「難しい」サンプルに対処できる指標が自然に選択される.さらに,選択された指標を用いて,最終的な識別関数(予測モデル)の構築までが単一の枠組みの中で扱われる.
評価実験の結果として,抽出する財務比率の数が増えるにつれて,識別精度は向上していくことが分かった.特に抽出する財務比率の数が4(識別率0.893)に達するまでは,識別率の上昇の程度が大きい.財務比率の数が5を超えると識別率の上昇は緩やかになり,財務比率の数が10の時に識別率0.907,財務比率の数が20の時に0.92である.Real
AdaBoostによる予測精度は,オリジナルのAdaBoostと比較すると,財務比率数1-30の範囲で,平均4.14%の精度向上が見られ,提案手法の有効性が確認された.