同じ「反応速度テスト」でも、測っているものが違う
結論を先に言うと——どれで遊んでも楽しいし、どれも間違いではありません。ただ、数字を何かの判断材料にしたいなら、方式の違いは知っておく価値があります。
| 方式 | 試行数 | 統計量 | フライングの扱い | 向いていること |
|---|---|---|---|---|
| 定番のウェブテスト (Human Benchmark など) | 数回 | サイトにより異なる (算出方法を明記しないものも多い) | やり直し | 友達との比較・腕試し |
| ゲーマー向け反応テスト各種 | 1〜10回 | 単発 or 平均 | まちまち | ウォームアップ |
| 研究用 PVT | 10分間 (数十〜百回超) | 中央値・lapse 数・逆数平均など複数 | エラーとして計数 | 覚醒度・疲労の研究計測 |
| AXIOM 無料テスト | 5回 | 中央値 + ばらつき + 最大の遅れ | 早押しとして計数・表示 | 「自分の普段」との比較の入口 |
※ 各サービスの仕様は2026年6月時点で筆者が公開版を試した範囲の整理です。
違いがいちばん効くポイント: 平均か、中央値か
反応時間の分布は右に裾を引きます——たまに大きく遅れる試行が混ざる。このとき平均は遅い1回に引きずられ、中央値は引きずられません(詳しくは用語集)。
多くのウェブテストはスコアの算出方法(平均か中央値か)を明記していません。もし平均で「今日は遅い」と出たなら、それは「全体に遅かった」のか「1回だけ大きく抜けた」のか区別できません。実はこの2つは意味が違います。後者——時々大きく抜ける——は、注意の途切れ(τ)として、覚醒度研究で独立に扱われてきた成分です。
研究用の PVT が10分もかけて lapse(大きな遅れ)を数えるのは、まさにこの成分が知りたいものだからです(PVT とは)。
どのテストにも共通する限界: ブラウザと機器の遅延
どのウェブテストにも共通する正直な注意点があります。ブラウザ計測には1〜2フレーム(約16〜33ms)の不確実性があり、ディスプレイやマウスの遅延も数字に乗るということです。
これは私たちのテストも例外ではありません。Human Benchmark の公式サイト自身も、PC やモニタの遅延がスコアに数十ミリ秒(10〜50ms 程度、テレビでは 150ms に達する場合も)乗りうることを明記しています——この点を正直に書いているのは立派なことだと思います。校正された研究環境の大規模計測では成人の単純反応時間は平均約231ms(機器遅延補正後で約213ms、N=1469; Woods et al. 2015)と報告されていますが、ウェブテストの数字はそれより数十ms遅く出るのが普通です。異なるサイト・異なる機器の数字を比べることには、あまり意味がありません(私たちがランキングを作らない理由でもあります → なぜランキングを作らなかったか)。
意味があるのは、同じ環境・同じテストで測り続けたときの、自分自身の変化です。
使い分けの提案
- 腕試し・友達と遊ぶ → 定番ウェブテストで十分楽しい
- 研究水準の覚醒度計測 → 10分の PVT(ただし毎日10分はかなりの根気が要ります)
- 「いまの自分は普段と比べてどうか」を知る入口 → 短くても中央値+ばらつき+最大の遅れが分かれて出るもの
3番目が私たちの設計です。30秒・登録不要で、5回の中央値・ばらつき・最大の遅れと、参考としての集団内のおおよその位置が出ます。