短期大学データを公開しました

2019-12-06

短期大学のデータを公開しました

全国大学データに続き全国短期大学データを公開しました。 フォーマットはCSVです。収録されているデータの種類は大学と同じとなっており、データ数は約260校、約9100件です。

サンプル画像

データフォーマットの悩み

将来的にはWebAPIの公開も考えていますが、 WebAPI の場合ですと通常 JSON がよく使われるフォーマットです。 また、開発者目線で見るとCSVでも問題はありませんが JSON の方が扱いやすいでしょう。

大学のデータで考えると大学名がありその大学には複数のキャンパスがあります。 現在ではこの様な表現方法となっていますが、これは多少扱いづらいでしょう。

大学A,キャンパス1,...
大学A,キャンパス2,...

例えば Ruby での簡易的なコードでこの様な処理となるでしょう。

college = {}
CSV.foreach(path) do |row|
  # 大学毎に複数データをまとめる処理
  college[row[0]] ||= []
  college[row[0]] << row
end

しかし JSON で公開した場合だと最初からこうした処理が必要なくなるでしょう。 また JSON であれば WebAPI に移行した場合にも処理に変更はほぼ発生しないでしょう。開発コストの低減にも繋がります。

ただ、現在公開されている開発用のデータやサービスを見回してみるとほぼフォーマットは CSV となっています。 OpenData に至っては PDF、Excel、XML 等の扱いづらいフォーマットも珍しくはありません。これらはほぼ論外です。 これは海外であっても同様で、海外の OpenData でも CSV が通常選択されているように思えます。

こういった状況での JSON での公開はどうなのかというのが最近の悩みの1つとなっています。 色々な意見を聞いてみたいですね。