「適性検査」の選び方
まずは解説書・マニュアル・質問冊子を一読し、
適切な検査かどうかアタリをつける
数多く提供されている「適性検査」を選択するには、それを導入する人事担当者に一定の基準を持って検査を見極める眼がなければいけない。その基準に関しては多少の専門的な知識が必要になってくるが、まずは“一般論”として適性検査の見分け方について触れておこう。
第一の基準としては、尺度得点は適切かどうかが挙げられる。これは「尺度名が測定したい内容を表しているか」、そして「測定したい性質をきちんと測れるような質問項目になっているかどうか」を確認することで判断できる。次に確認したいのは、「質問項目の数が適切かどうか」である。応募者への負担を軽減することも考えなければならないし、限られた時間で実施する場合、質問項目数には限度がある。しかし、質問数が少なすぎると、一つの質問への回答の影響が強くなりすぎ、個人差として特性を測定できない可能性が高まってしまう。以上2点について確認するためには、報告書の見本だけでなく、できれば質問冊子なども確認することをおすすめしたい。第三には「サンプリングデータの量・質は適切か」どうかが挙げられる。サンプリングデータとは比較対象となるデータのことであり、一般的には少なくとも1000人以上、かつ比較する対象として代表性を持った偏りのないデータであることが望ましい。
第四には「2回実施しても同じ結果が出るか」である。これは尺度の“信頼性”の問題であり、詳細は後に譲ることにする。第五には取り扱う側の環境として「結果が見やすく表示されているか」である。数多くの応募者の特徴を見極めるには解説書やマニュアルを熟読し、読み取りのスキルを身につけておく必要がある。とはいえ、実際に検査結果が見やすく表示されているか、誤解を招くような表現がなされていないかなど、報告書サンプルを確認して判断したい。第六には「実施方法は適切かどうか」である。自社で行う場合には実施方法が十分に解説されているか、適性検査提供会社が実施する場合には丁寧に実施されているかどうかが重要な基準となってくる。正しい実施方法は正しい結果を活用するための大前提だと考えれば、当然のことであろう。
以上、一般的な「適性検査」の選び方をまとめると以下となる。これらを、本格的な導入検討前の予備審査的な確認項目とすれば、アタリをつけることができ、第一次の絞り込みができるだろう。
- □ 尺度得点は適切か
- □ 質問項目数が適切か
- □ サンプリングデータの量・質は適切か
- □ 2回実施しても同じ結果が出るか
- □ 結果が見やすく表示されているか
- □ 実施方法は適切か
科学的な基準からも適性検査をチェックする
次に少し専門的な話にはなるが、科学性に関する基準について解説したい。科学性に関する基準としては「信頼性」「妥当性」「標準性」の3つがある。
「信頼性」で測定の安定性と一貫性を確認する
「信頼性」とは測定の安定性や一貫性を意味する概念で、一般的には解説書やマニュアルに「信頼性係数」として表示されている。“測定の安定性”については、算出方法に再検査法が用いられ、同一人物に対する2回の測定値間の相関係数として表されている。一方、“測定の一貫性”については内的整合法が用いられ、質問項目間の相関係数をもとに算出される。ただし、これらは検査ごとではなく尺度ごとに計算されるものであるため、心理統計に基づかない投影法や作業検査法といった適性検査では表示することができない。
また、信頼性係数の目安は、能力検査の場合、0.7~0.8、性格検査では0.6~0.7と考えられているが、能力検査のなかでもスピードを要求する検査の場合は内的整合法ではなく再検査法による信頼性係数が用いられるため、係数が高くなり0.8~0.9が目安となる。つまり、検査内容・質問の質・係数の算出方法などによって係数が変化するため、信頼性係数は適性検査を選ぶ際の大きな目安となるが、数値だけを見て安易に比較できるわけではないことに留意したい。
目的に叶った検査かどうかの「妥当性」を検証する
次に「妥当性」であるが、これは適性検査の内容が利用目的や場面にどれほど相応しいかという問題である。ただし、「信頼性」が「信頼性係数」として数値化されるのに対し、「妥当性」は数値として一般化することができない。なぜなら、たとえば検査で予測したいものが人事評価である場合、検査結果と人事決定は直接的な関係を持っていないため、その検査がどれだけ目的に叶っているかは係数として算出できないからである。さらにいえば、妥当性とは適性検査固有の問題ではなく、各ユーザー企業、各職務の問題ともいえる。そのため、仮に解説書・マニュアルに係数が表示されていた場合でも、必ず“特定の事例”に対する妥当性係数として提示されたものであり、一般論ではないことを理解しておく必要があるだろう。
では、妥当性を確認するにはどうすればよいのか――まずは適性検査の背景となる理論・測定技術・質問内容や水準・設問表現・受検者に与える印象などから妥当性を検討することからすすめたい。解説書やマニュアル・質問冊子を一読することで、ある程度、推測ができるだろう。
また、本格的に妥当性を検証するには、各社で適性検査と職務行動との関係を調査することが求められる。その際人事評価データの収集と、目的によっては評価基準データ(基準変数)を算出。これに適性検査の尺度(予測変数)を照らし合わせ、統計的に関係性を確認することになる。
この統計手法の代表的なものには「平均」と「標準偏差」などがあるが、ほかにも最高値と最低値の距離を出す「レンジ」、ばらつきを見る「度数分布」、テストがどの程度関係があるかの「相関係数(妥当性係数)」、人事評価などの基準で対象者上位群(G群、GOOD)と下位群(P群、POOR)を出し、両群間で検査尺度の値がどのように異なるか比較する「G・P分析」、2つの変数間の関係をシンプルに視覚的に表す「散布図」などが用いられる。ただし、いずれの統計手法を取っても、不採用者のデータを含んでいないこと、基準となる人事評価や満足度の正しい測定が困難なことなどから、妥当性検証の結果には誤差が含まれることに留意しておかなければならない。
母集団に対して受検者個人の位置を示す「標準性」
最後に「標準性」だが、各受検者の検査結果をいかに標準化するかという問題である。正しく結果を解釈するには、比較基準となる集団において、どのくらいの位置にあるかを確認できる必要がある。また導入する検査の種類を選ぶ際も、検査対象として想定されている母集団と、実際に検査を実施する対象者が重なっているかどうかを確認するとよい。また、標準化のために用いられるデータの量は十分であり、質には偏りがないかどうか、運用後もその都度、結果が検証され、微調整がなされているかなどがチェック項目となる。
ともすれば、適性検査の選択基準は人事担当者の負荷軽減や予算の都合などから、所要時間や手続き、採点サービスの内容、コストなどに目が向きがちである。しかし、正しい検査結果があって初めて優秀な人材を採用することができる。もちろん、科学的な見地からの「信頼性」「妥当性」「標準性」が絶対的な指標でないことも先に述べたとおりであるが、出来得る限りの情報を検討したうえで、導入する検査を決定したい。