Fuzina の立ち上げについて

2019-12-02

この度 Fuzina というサービスを立ち上げる事としましたので、目指したい事などを紹介したいと思います。

まずは私の開発者としての今まで経験した中での1つの不満点を。 私は開発者として様々な経験をしてきました。少ない成功と多くの失敗、多くの不満点があります。 それぞれについては語りませんが、その中の不満や不便な点の1つとして Webサービス開発での不満点の1つにマスターとなるデータの不足があります。

データ入手の難しさ

例えば、とあるWebサービスで住所に基づく対象の検索が必要となる場合です。サービスはなんでも良いのですが例えば賃貸物件の検索等のようなサービスを想像してください。

物件を検索するには市区町村のような検索はさほど難しくありません。 文字列での検索も可能ですし、より良いやり方だと郵便番号での検索、国が決定している都道府県コードや市区町村コード (全国地方公共団体コード:wikipedia) がありますのでこれらの紐づけを行い検索する事はさほど難しくありません。

例えばある駅、大学等の何らかの対象からの一定距離にある物件を探す場合が分かりやすい例でしょう。 こういったデータをすべて見つけ出すのは非常に難易度が高い作業となりますし、苦労してデータを何らかの方法で入手してもそこから検索して表示してと非常にコストが必要でしょう。 データ入手後の開発は当然ののコストですが、その前のデータ入手にコストが高くなるのはなるべく避けたいでしょう。

OpenData 等での入手や購入といった手がありますがそれらにも不満が常につきまといます。 OpenData はデータが古い、商用利用は不可、市区町村レベルで個々独自で公開している、データフォーマットがPDF等の開発者から見た場合非常に扱いづらい、等が理由です。

購入の場合であれば非常に高価な場合 (Qiitaによると国土地理協会の駅データの例で初年度160万円、次年度以降30万円) が多く組織の上層部との交渉などが発生するでしょう。個人サービス、起業したばかりの会社であればそもそも入手が不可能でしょう。

他の問題として入手してからデータの不足がある場合もあるかもしれません。 例えば以前私がいた組織では駅データを購入していましたが位置情報が無い、無償で入手出来るデータには一部の路線や鉄道の種類 (例えばモノレール等) が含まれていない等があり実際には使い物にならないという状況が有りました。

データの作成

では実際にデータを作成する方法はどうでしょうか。 駅データに問題があった件で、私は自前でデータ作成を試みました。

データをどこから入手するか、必要なデータが存在するか、データの入手/更新の自動化問題など非常に手間が掛かる作業が必要となります。 私がこれらの調査を行いつつコードを完成させましたが、記憶では1.5ヶ月前後ほどの時間を要しました。かなりの残業込みでしたので定時での作業となると恐らく倍以上の時間が必要だったでしょう。

これは駅データの例ですが他のデータでも同様の難易度ですし、データによっては入手自体が非常に難しい場合、必要なコストがさらに増える場合も珍しくないでしょう。

どういう状態が理想か?

理想であれば OpenData でデータが一括で取得出来るのが一番でしょうが実際問題難しいでしょう。 OpenData の支援プラットフォーム LinkData.org なども有りますがそれぞれのデータを見ると特定の市区町村のみと便利とは言い難い状況です。他のサービスも似たようなものです。

こういったサービスには期待はしていますがまだ時期が早いということでしょう。

ではどういった状態が理想かと考えた場合、私の開発者目線からでは大まかにはこのような形でしょう

  • データが1箇所ですべて取得できること
    • 1サービス、サービス内での同じデータは全国で一括取得できる
  • 開発者が扱いやすいフォーマットであること
  • データ不足が無い/少ないこと
  • APIがあれば尚良し

サービスの立ち上げ

こういった状況をなんとかできないかという思いは以前から持っていました。 ただ、データ作成を経験した身からすると難易度もかなり高めというのも理解しています。 そもそもこういった作業には通常のエンジニアリングとは異なり、どのデータが必要かといった判断力、データ収集の能力、データのクレンジング、データの妥当性チェック等の能力が必要となります。

データが揃うまで待っても期待は難しいでしょう。 こういった思いと私自身のタイミングもありサービスを立ち上げる事としました。 まだまだ立ち上げたばかりではありますが頑張って行きたいと思います。 興味を持って頂ければ幸いです

ちなみに、Fuzina (ふじな) とはタンポポの古名です。タンポポはキク科の植物で複数の花が1つの花のように見える点が特徴との事。 1つ1つをデータに見立てて名前に付けました。あまり一般的な名称だとサービス名にしづらいですしネーミングは難しいです。

現在 Stores で大学データを取り扱っています。 よろしくお願いいたします!