福島の水道水中の放射性物質グラフ(半自動描画)


なお,(時間軸が粗いが)全国の県に渡って比較できるグラフを描いてる方がいらっしゃる:

作り方

  1. PythonRubyGnuplotcurl(1) をインストール
  2. 新山さんの PDFMiner をインストール(Pythonで書かれている)
  3. 以下のワンライナー福島県の発表したデータのPDFを一括取得(サーバに負担をかけるので控えめにね.大した負荷ではないと思うが)
    • i=22; while )((i-->0))(; do f=sokuteichiinryousui${i}.pdf; curl -O "http://www.pref.fukushima.jp/j/$f"; if grep -q 404 $f; then rm $f; break; fi; done
    • "i=22" というのは,今現在の最新が "sokuteichiinryousui22.pdf" なので
    • 今後は「携帯用」HTML版*1を読むのがよいだろうね.PDFMiner も,怪しげな解析スクリプトも要らない.
  4. PDFMiner のコマンド pdf2txt.py で .pdf を .txt に一括変換
    • for i in sokuteichiinryousui*.pdf; do pdf2txt.py $i > ${i/.pdf/.txt}; done
  5. RubyスクリプトでデータをCSVに集約
    • parseFksmWater.rb sokuteichiinryousui*.txt > fskmwater.csv
  6. Gnuplotスクリプトでグラフ描画
    • gnuplot fksmWater.plt

まぁCSV化したのを置いておくんで...

このデータの転載っていいのかなぁ.スクリプトに間違いがあって酷いデマを広めたりしたら嫌だなぁ.できれば上記の手段で,かつ各ステップをソースを読みながらよく確認して手元で実行して下さい.ソースはCSVと同じディレクトリに置いてある.ただ,PDFMiner はかなり重いソフトです.達成しようという目的がかなりの無理ゲーなんで仕方ないことで,むしろここまで動くのはさすが新山さんと言うべきところだが...
どうでもいいが実験データのプロットを線で結ぶのは負けた気分だ... eye guideは何らかの関数,またはせめて3頂点の折れ線でないと気持ち悪い.まぁ何の根拠もなくgaussianや2次関数をeye guideに使ったことは何度もあったけど.目的を持ってデザインした実験のデータは何らかの規則性を持って並ぶ(はず/ことが多い/といいなぁ)けど今回のデータはそうじゃないのと,よく分からんが野地さんまでもが線で結んだグラフを公開してたので「科学の集中訓練を受けてない一般人が見るかもしれないグラフってこうした方がいいのかな」とか迎合姿勢を見せてそうしてみた.そもそもエラーバーが無い実験データとかアレなんだが... まぁ隣の点との差からお察し下さいということかな.
TODO: 福島県が第23報を発表したら,そこから先は携帯用HTMLからデータを取得するようにする.ただ,big scienceでない,hand-craftedな実験科学の経験がある人なら分かると思うが,こういうのって結局 手動でExcel(Igor Proもよく使った)にデータ打ち込みが一番確実で早いんだよね... データが100点ぐらいまでなら自動化の労力の方が損.