反応速度テストの数字はサイトによって違いますか？

違います。試行数・統計の取り方（平均か中央値か）・フライングの扱いが方式ごとに異なるうえ、ブラウザ計測にはデバイスやディスプレイの遅延が乗るため、異なるサイト・異なる機器の数字を比べることにはあまり意味がありません。意味があるのは、同じ環境・同じテストで測り続けたときの自分自身の変化です。

平均と中央値ではどちらが良いのですか？

反応時間の分布は右に裾を引く（たまに大きく遅れる）ため、平均は遅い試行に引きずられ、中央値は引きずられません。「全体に遅かった」のか「1回だけ大きく抜けた」のかを区別したい場合、中央値とばらつき・最大の遅れを分けて見る方式が役立ちます。

ブラウザの反応速度テストは正確ですか？

どのウェブテストにも原理的な限界があります。ブラウザは刺激が画面に表示された正確な瞬間を知ることができず（1〜2フレーム＝約16〜33msの不確実性）、ディスプレイや入力機器の遅延も数字に乗ります。数値は参考目安として扱うのが適切です。

反応速度テストの選び方 ― 方式の違いで何が変わるか

「反応速度テスト」で検索すると、たくさんの無料テストが出てくる。どれも「合図が出たらクリック」という見た目は同じだが、試行数・統計の取り方・エラーの扱いが違っていて、その違いが「出てくる数字の意味」を変える。代表的な方式を公平に整理する。

同じ「反応速度テスト」でも、測っているものが違う

結論を先に言うと——どれで遊んでも楽しいし、どれも間違いではありません。ただ、数字を何かの判断材料にしたいなら、方式の違いは知っておく価値があります。

方式	試行数	統計量	フライングの扱い	向いていること
定番のウェブテスト (Human Benchmark など)	数回	サイトにより異なる (算出方法を明記しないものも多い)	やり直し	友達との比較・腕試し
ゲーマー向け反応テスト各種	1〜10回	単発 or 平均	まちまち	ウォームアップ
研究用 PVT	10分間 (数十〜百回超)	中央値・lapse 数・逆数平均など複数	エラーとして計数	覚醒度・疲労の研究計測
AXIOM 無料テスト	5回	中央値 + ばらつき + 最大の遅れ	早押しとして計数・表示	「自分の普段」との比較の入口

※ 各サービスの仕様は2026年6月時点で筆者が公開版を試した範囲の整理です。

違いがいちばん効くポイント: 平均か、中央値か

反応時間の分布は右に裾を引きます——たまに大きく遅れる試行が混ざる。このとき平均は遅い1回に引きずられ、中央値は引きずられません（詳しくは用語集）。

多くのウェブテストはスコアの算出方法（平均か中央値か）を明記していません。もし平均で「今日は遅い」と出たなら、それは「全体に遅かった」のか「1回だけ大きく抜けた」のか区別できません。実はこの2つは意味が違います。後者——時々大きく抜ける——は、注意の途切れ（τ）として、覚醒度研究で独立に扱われてきた成分です。

研究用の PVT が10分もかけて lapse（大きな遅れ）を数えるのは、まさにこの成分が知りたいものだからです（PVT とは）。

どのテストにも共通する限界: ブラウザと機器の遅延

どのウェブテストにも共通する正直な注意点があります。ブラウザ計測には1〜2フレーム（約16〜33ms）の不確実性があり、ディスプレイやマウスの遅延も数字に乗るということです。

これは私たちのテストも例外ではありません。Human Benchmark の公式サイト自身も、PC やモニタの遅延がスコアに数十ミリ秒（10〜50ms 程度、テレビでは 150ms に達する場合も）乗りうることを明記しています——この点を正直に書いているのは立派なことだと思います。校正された研究環境の大規模計測では成人の単純反応時間は平均約231ms（機器遅延補正後で約213ms、N=1469; Woods et al. 2015）と報告されていますが、ウェブテストの数字はそれより数十ms遅く出るのが普通です。異なるサイト・異なる機器の数字を比べることには、あまり意味がありません（私たちがランキングを作らない理由でもあります → なぜランキングを作らなかったか）。

意味があるのは、同じ環境・同じテストで測り続けたときの、自分自身の変化です。

使い分けの提案

腕試し・友達と遊ぶ → 定番ウェブテストで十分楽しい
研究水準の覚醒度計測 → 10分の PVT（ただし毎日10分はかなりの根気が要ります）
「いまの自分は普段と比べてどうか」を知る入口 → 短くても中央値＋ばらつき＋最大の遅れが分かれて出るもの

3番目が私たちの設計です。30秒・登録不要で、5回の中央値・ばらつき・最大の遅れと、参考としての集団内のおおよその位置が出ます。

反応速度テストの選び方 ― 方式の違いで何が変わるか

同じ「反応速度テスト」でも、測っているものが違う

違いがいちばん効くポイント: 平均か、中央値か

どのテストにも共通する限界: ブラウザと機器の遅延

使い分けの提案

関連記事

中央値＋ばらつき＋最大の遅れで測ってみる