手法公開 基幹統計4兆円過大 朝日新聞はこう試算した

 国土交通省による基幹統計「建設工事受注動態統計」の不正。本省職員らがデータを無断で書き換えて二重計上したことで、統計はどれだけ過大になっていたのか。朝日新聞が2020年度分に絞って過大額を試算したところ、約4兆円に上っていた疑いがあることがわかった。試算は公表済みのデータを基に専門家らの助言を得ながら慎重に進めた。

単純な引き算だが……

 過大になっている不正な統計から、正しい統計を引けば、差額がわかる。その差額が「過大額」だ。単純な引き算ができればいい。

 不正な統計をAと表記して考えていく。公表済みだが、書き換えにより過大になっているものだ。

 正しい統計をBと表記して考える。これは公表されていないものだ。

 AとBを使って式に表すと簡単に見える。

 A-B=過大額

 この計算をすることが目標となる。

20年度の統計は2パターンあった

 20年度の1年間だけに絞って考えることにした。

 20年度は、国交省の本省職員が書き換え行為を行っていた時期だ。具体的には、本来、合算すべきでない受注実績を、計2カ月分、合算して集計していた。

 まず調べたのは、そもそも何が公表されているのか、だ。

 Aは公表されている。Bは非公表。そのほかに、Aとは別のパターンの20年度の統計が公表されていた。これをCを表記して考えることにした。

 Cとは何か。具体的には、21年度から新たに導入された計算ルールをさかのぼって20年度の統計に適用したものだ。書き換え前の正しいデータを基につくられているから、二重計上による上ぶれは原則として生じていない。

 AとCの違いを整理するとこうなる。

 A 旧計算ルール(~20年度)で計算した20年度の統計。不正な書き換えによる過去分データの合算あり。

 C 新計算ルール(21年度~)をさかのぼって使い計算した20年度の統計。不正な書き換えによる過去分データの合算なし。

前提が違う

 計算ルールが新旧で異なるため、AとCを単純に比べることはできない。Aは過去分のデータが不正に合算された過大な統計で、Cは過去分の合算がなく過大になっていない統計だが、単純に「A-C」という計算をしても「過大額」を知ることはできないわけだ。

 そこで、前提条件をそろえる方法を探ることにした。

 まず欠かせないの、新旧の計算ルールの違いを理解することだ。国土交通省はホームページにその説明文を掲載していた。

 新計算ルールでは、旧計算ルールに新たに「係数」(母集団の欠測値を埋めて補正するためのもの)をかける、という概要だ。単純にイメージを記すと次のようになる。

 旧計算ルールの統計×係数=新計算ルールの統計

 記号で書くとこうだ。

 B×係数=C

 この式を次のように書き換える。

 B=C÷係数

 係数さえわかればBもわかることになる。Bがわかれば答えもわかる。少し光が見えた気がしたが、その先が険しかった。

迷路に迷い込んだ

 公表されているAには、書き換えられたデータが使われている。同じく公表されているCには、書き換えられたデータが原則として使われていない。書き換えありと、書き換えなし。違いのあるデータを、同じ式の中に入れて考えることはできない。

 取材チームは迷路に迷い込んでしまった。ゴールにつながる道がどこかにないか。手分けをして探るかのように、複数の専門家の助言を得ながら検討を続けた。

カギは「4月」だった

 浮かんできたキーワードは「4月」だった。

 今回の統計不正で問題になっ…

Source : 社会 – 朝日新聞デジタル

Japonologie:
Leave a Comment