国土交通省による基幹統計「建設工事受注動態統計」の不正。本省職員らがデータを無断で書き換えて二重計上したことで、統計はどれだけ過大になっていたのか。朝日新聞が2020年度分に絞って過大額を試算したところ、約4兆円に上っていた疑いがあることがわかった。試算は公表済みのデータを基に専門家らの助言を得ながら慎重に進めた。
単純な引き算だが……
過大になっている不正な統計から、正しい統計を引けば、差額がわかる。その差額が「過大額」だ。単純な引き算ができればいい。
不正な統計をAと表記して考えていく。公表済みだが、書き換えにより過大になっているものだ。
正しい統計をBと表記して考える。これは公表されていないものだ。
AとBを使って式に表すと簡単に見える。
A-B=過大額
この計算をすることが目標となる。
20年度の統計は2パターンあった
20年度の1年間だけに絞って考えることにした。
20年度は、国交省の本省職員が書き換え行為を行っていた時期だ。具体的には、本来、合算すべきでない受注実績を、計2カ月分、合算して集計していた。
まず調べたのは、そもそも何が公表されているのか、だ。
Aは公表されている。Bは非公表。そのほかに、Aとは別のパターンの20年度の統計が公表されていた。これをCを表記して考えることにした。
Cとは何か。具体的には、21年度から新たに導入された計算ルールをさかのぼって20年度の統計に適用したものだ。書き換え前の正しいデータを基につくられているから、二重計上による上ぶれは原則として生じていない。
AとCの違いを整理するとこうなる。
A 旧計算ルール(~20年度)で計算した20年度の統計。不正な書き換えによる過去分データの合算あり。
C 新計算ルール(21年度~)をさかのぼって使い計算した20年度の統計。不正な書き換えによる過去分データの合算なし。
前提が違う
計算ルールが新旧で異なるため、AとCを単純に比べることはできない。Aは過去分のデータが不正に合算された過大な統計で、Cは過去分の合算がなく過大になっていない統計だが、単純に「A-C」という計算をしても「過大額」を知ることはできないわけだ。
そこで、前提条件をそろえる方法を探ることにした。
まず欠かせないの、新旧の計算ルールの違いを理解することだ。国土交通省はホームページにその説明文を掲載していた。
新計算ルールでは、旧計算ルールに新たに「係数」(母集団の欠測値を埋めて補正するためのもの)をかける、という概要だ。単純にイメージを記すと次のようになる。
旧計算ルールの統計×係数=新計算ルールの統計
記号で書くとこうだ。
B×係数=C
この式を次のように書き換える。
B=C÷係数
係数さえわかればBもわかることになる。Bがわかれば答えもわかる。少し光が見えた気がしたが、その先が険しかった。
迷路に迷い込んだ
公表されているAには、書き換えられたデータが使われている。同じく公表されているCには、書き換えられたデータが原則として使われていない。書き換えありと、書き換えなし。違いのあるデータを、同じ式の中に入れて考えることはできない。
取材チームは迷路に迷い込んでしまった。ゴールにつながる道がどこかにないか。手分けをして探るかのように、複数の専門家の助言を得ながら検討を続けた。
カギは「4月」だった
浮かんできたキーワードは「4月」だった。
今回の統計不正で問題になっ…
Source : 社会 – 朝日新聞デジタル