第2回東京公共交通オープンデータチャレンジが始まりました。
メモ書き程度に気付いたことを書いていこうと思います。

<会社毎の提供データ表>(提供予定も○にしてある)

運行情報在線乗降者数運賃路線系統駅時刻表列車時刻表画像
JR東××
東京メトロ
都交
東急×××
東臨×
東武×××
西武××××
小田急×××
京成×××
京王××
京急××
ゆりかも××××

・JR東日本の補足
運行情報:全路線
在線:山手・中央快速・中央総武緩行・五日市・常磐緩行・常磐快速・埼京・川越・京浜東北・根岸・京葉・武蔵野・南武・青梅・総武快速・横浜・横須賀(+湘南新宿ライン・常磐線(中距離)・中央線(中距離)の一部)
乗降者数・駅・路線系統・駅時刻表・列車時刻表:<在線>の路線に加えて八高・相模・鶴見・南武線浜川崎支線(通称:南武支線)
※KawagoeとSaikyoKawagoeの違いは高麗川~川越間と川越~大宮~大崎間。実際にも明確に系統分離がなされている。
※在線では一部中距離電車と特急・ライナーを含むが、駅時刻表・列車時刻表はそのデータを持たない。

・東京都交通局の補足
在線:都電荒川線のみ。trainNumberには車両番号(数字4桁)が入る。
乗降者数:都電荒川線を除く。


<odpt:TrainInformation>
・『JR東日本の全路線についての運行情報を提供します。』との説明通り、五能線(青森の方を走っている路線)や新幹線の情報が流れてくる。恐らくデータ元はどこトレと同じものだろう。普通に考えて要らないので、情報を取捨選択する必要がある。
・京王はtrainInformationTextに長文を載せる場合がある。
・逆に小田急は見出ししか書かない場合がある。「ロマンスカー運休について。」とか書かれても困る。深夜は「サービス対象時間外となります」とのさばるが、そういうことはちゃんとしたサービスを提供してから言ってほしい。
・JRは情報が無ければ何も出てこないが、他は大体「平常通り運転しています。」とか流してくる。
・ちなみに、JRのtrainInformationText->jaにはXX~YY駅間など、「~」を使うことがあるが、使わtれるのは波ダッシュ(0x301C)ではなく全角チルダ(0xFF5E)の方である。(上記二例は波ダッシュ。念のため。)
・各社毎に文面・フォーマットがバラバラ。せめて振り替え輸送の有無、あるならその路線、くらいは各社統一して分けて欲しい。このデータを見るだけでデータフォーマット共通化は程遠いと実感することが出来る。
・(09/18追記分)都営や京成線にodpt:trainInformationStatusやodpt:trainInformationCauseTitleが追加された。が、 「odpt:railway: "odpt.Railway:JR-East.都営三田線"」となったりしている。どうしたものか。
・(09/18追記分)メトロにはodpt:trainInformationStatusのみ追加されている。相変わらず”予告されない”仕様変更が多い。


<odpt:Railway>
・接続先の各線のデータも含まれる。行先とか関係ある駅だけかと思いきや、何故か奥羽本線や上越線や中央本線(高尾~小野)が入ってたりする。使い方にもよるだろうが、データを取捨選択した方がいいだろう。修善寺(特急踊り子号の行先)などの扱いについては作りたいものを決めたうえで考えるべきだろう。
・東京モノレール羽田空港線は路線名等は得られるが駅情報は得られない。(ちなみに某アプリでは蒲蒲線が路線として存在している。)


<odpt:Train>
・中距離、特急、ライナーが一部出る。出ないものもある。
・東海道線の列車は表示されるが、東海道貨物線の列車は表示されない。武蔵野線国立支線等も然り。(正確に言えば、武蔵野線国立支線西国分寺駅(運転上の駅)までは表示されるが、西国分寺~国立の在線が抜ける。)
・臨時特急、臨時快速などは営業列車であれば出るが、種別が抜ける場合がある。また、定期ではない行先も出る場合があるため注意が必要。(例:大垣、白馬、沼田など)
・メトロは大体1分以内のデータを送ってくれるが、JR東日本は平気で3分前のデータを送ってくる。3分あれば1駅分変わってきてしまうこともあるだろう。たかが3分、されど3分である。まさか業務用アプリとか指令でこの精度のデータを使っている訳じゃ無いだろうし何とかしてほしいのだが。
・都電は更新タイミングによっては入庫直前の車両のデータが残ることがある。dateを見て判断すべし。(ちなみに某アプリも昔こんな挙動をしていた。今は改善されたようだが。)
・データの提供が止まる(延々過去のデータを返す)ことがある。例を挙げれば
、08/30 12:40頃まで08/29 20:30頃のデータを返し続けていた。
・武蔵野線西船橋、横須賀線逗子、東西線中野、京浜東北線大宮などでは種別が抜ける場合がある。
・上の種別が抜ける件、多分ATOSというかシステムに情報が入ってない状況なのでしょうね。行先のデータは入っているのに両数のデータが抜けています。
・メトロの方でデータに触れている人には既知の事実であるだろうが、メトロの車両所属社の部分は必ずしも実際のものとは一致しない。列番末尾のアルファベットが示す会社が常にその部分に入り、代走等は考慮されない。それなら列番で分かるからここの部分要らないね
・現在提供開始前のようだが、東急線の駅名も始発/行先駅として返る。


いつも通りのメモなので気が向いたら追記します。
(更新:18/09/26)