IQ 創造性テストと実社会能力の関係

創造性テストは、基本的に、多様なアイデアや解の産出を評価する発散思考(Divergent Thinking：DT)テストである。DTテストには、ギルフォードの米国心理学会会長就任講演(1950)以来長い歴史があり、その信頼性、妥当性に関してさまざまな議論が続いてきたが、まだ決定的な結論は出ていない。しかし現状と将来見通しはどうだろうか？検討する。

村上が、将来の勤務成績をよく予測する新入社員選抜方法は何か、に関してシュミットとハンターの85年間の諸研究の大規模なメタ分析の結果を紹介している。それによると、実際の仕事テスト(0.54：修正済みの予測的妥当性=相関係数)、知能(IQ)テスト(0.51)、構造化面接(0.51)、仲間の評価(0.49)、仕事の知識テスト(0.48)、行動の一貫性評価(0.45)、見習い期間の仕事テスト(0.44)、と続く。アセスメントセンター(0.37)、自伝的データ(0.35)は中程度で、仕事の経験年数(0.18)、過去に受けた訓練や経験の得点化(0.11)、教育年数(0.11)、興味(0.11)などの予測妥当性は低い。要するに、知能テスト(一般知能g)は、他の選抜手法(評価法)に比して、将来の勤務成績の予測妥当性やコストパフォーマンスがとくに高いことがわかる。専門的・管理的仕事に限定すると、この相関は0.58とさらに高くなるという。

paper & pencil(紙と鉛筆)テストでも、長年かけて有効性を改善してきたIQテストなら、現場での仕事チェックや丁寧な面接や仲間評価と同等あるいはそれ以上の予測妥当性があることは興味深い。しかしそのように長年洗練されてきたテストは少ないのだから、ブームに乗って出てきた“コンピテンシーテスト”などの有効性には注意が必要だ。またそもそも、0.58の相関といっても説明率はその二乗で約34％にすぎない。現象の3分の2は説明できないのである。

ソーヤーがおもしろい実験を紹介している。質的に同等な2集団の一方にはアップル社のロゴを、他方にはIBM社のロゴを見せ、直ちにUnusual Uses(DT：発散思考)テストを実施した。その結果、前者が有意に高い創造性評価を得たのである。会社のイメージ刺激(プライミング)が簡単に創造性(DT)テストの成績を左右してしまうのである。

またワイズマンは、事前のちょっとした暗示(プライミング)や動作で創造性(DT)テストの結果が左右される研究を複数紹介している。例えば、技術者(保守的で論理的)／パンク(過激で反社会的)の行動・生き方・外見について短文を書かせる、12の濃いグリーンの十字架の絵／その中に1個だけ黄色の十字架のある絵を見せる、机を押す／引く動作をする場合などで、後者のDTテスト成績が有意に高かった。

このように、ちょっとした刺激・教示・環境等の操作で簡単にDTテスト得点が変化してしまうことは1980年ころから指摘されてきた。DTテストが測定しているのは安定した個人特性(personal traits)ではなく、選択された1つの解法(strategy)（としての特定の自動処理モード）ではないか、という疑問が生じる。

キムらはそれまでの多くの関連諸研究のメタ分析によって、以下のことを見出した。

DTテストは成人の創造的達成をIQテストよりは多少良く予測する(相関係数0.216＞0.167)。
相対的に、IQテストは創造性の量を、DTテストは質をより良く予測する。
相対的に、DTテストでは美術、著述、科学、社会スキルを、IQテストは音楽をより良く予測する。リーダーシップに関しては同等であった。

この結果は、DTテストが、成人の創造的達成の4％程度しか予測・説明できないことを示している(0.216×0.216)。IQテストが将来の勤務成績の25％程度を予測できることと比較してみるとよい(0.51×0.51)。事例的にも実証研究的にも、DTテストと実社会(現実)の創造性発揮との相関は一貫して低かった。またギルフォードは、DTテストの有効性は、最終的には実社会の創造性発揮との関係を確かめることによって評価される必要があると述べていたが、これが殆どなされてこなかった。この点は最近のIQテストも類似しているが、初期のIQテストの作成過程では、まさに現場の評価との比較においてIQテスト項目の作成・洗練がなされてきたのであった。

多くの学問領域で、領域特殊なパラダイムに基いた研究発展がなされる。クーンのいう“通常科学”はそういうものだろう。思考心理学や創造性研究でも領域特殊性(固有性)(domain specificity)が注目されてきた。それをどう克服するかは大きな問題だが、明らかに有効なのは、現場を深く知ることである。KJ法の川喜田二郎は、それを、書斎科学、実験科学と対比において、“現場科学(field science)”として、現実の問題解決に重要な科学的探究方法論として提唱した。ケリーらのデザイン思考(実際は製品のデザイン・生産の活動段階説)では、それを、(製品利用の)現場への“共感(empathy)”として、最初の活動段階として位置づけた。

さてDTテストと実社会の創造性発揮との相関の低さは、(専門的)能力の領域特殊性(domain specificity)とも関係するだろう。要するに、DTテストがそれなりに意味を持つのは学習期の若者やしろうとを対象にした場合で、現実的・専門的能力の予測にはあまり役立たないということだろう。したがって、もしDTテストを実施するにしても、より有効なIQテストの補完としてセットで使用するが望ましいということになる。

歴史的に似た例として、社会心理学の“態度-行動の一貫性”問題が1960年代頃からあった。結論は、測定される態度が行動レベルに近づくほど態度と行動の相関が高くなる、ということであった。要するに、測定データが調べたい現象・現場に即したものになればなるほど妥当性は高まる、ということである。近年の領域特殊性問題とも絡むが、基本は現場の重要性、現場に戻って確認することの重要ということだろう。デザイン思考でいえば共感の重要性ということである。

なお補足であるが、ソーヤーは、DTテストは4種の下位スコア(流暢性、独自性、柔軟性、精緻性)から構成されるが、因子分析では、ただ1つの因子しか見つからない、あるいは相互の相関が非常に高いという、もう1つDTテストの問題点を挙げている(概念の構成妥当性問題)。

［文献］

村上宣寛(2007)「IQってホントは何なんだ？」日経BP
Sawyer,R.K.(2012). Defining creativity through assessment. In Sawyer,R.K. Explaining Creativity(second edition). ch.3(pp.37-62). Oxford U.P.
ワイズマン(2010)「その科学が成功を決める」文藝春秋（Wiseman,R.(2009). 59Seconds. Macmillan.）
Kim,K.H. (2008). Meta-analyses of the relationship of creative achievement to both IQ and divergent thinking scores. Journal of Creative Behavior, 42(2),106-130.
川喜田二郎(1967)「発想法」中公新書

(奥正廣)