自動運転・ADASのソフトウェア開発 | データセットの選び方とは?

近年、国内においても自動運転やADAS(先進運転支援システム)開発のニーズが非常に高まっています。中でも、自動運転やADASに関わるAIのアルゴリズムなどのソフトウェア開発は各社で競い合っている状況であり、「いかに効率よく開発を進めるか」が開発競争を勝ち抜く上での必須条件になっています。

そこで、今回は自動運転・ADASのソフトウェア開発において知っておきたい、「データセット」についてご紹介します。

1.なぜデータセットが必要なのか?

自動運転・ADASの開発には、ハードウェアから、センサー、ソフトウェアに至るまで、様々な技術が必要になります。その中でも、自動運転・ADASにおけるソフトウェア開発は競争が激しく、データ収集や性能評価において自社のみならず、外部のサービスもうまく活用することが、成功のカギとなります。

では、このデータ収集や性能評価をすべて自社で行うと、どのようなことが起きるのでしょうか。例えば、カメラから車間距離を測るシステムを開発する企業があったとします。開発したシステムが本当に正しい距離を計測できているのかを調べるには、リファレンスシステムとしてLiDARなどのレーザーセンサーを調達して、評価対象(この場合カメラ)と同期計測できるシステムを構築する必要があります。さらには、実際に走行した際のデータを計測するためにそれらのセンサーを設置した車両を用意し、ドライバーまでアサインする必要があります。

このデータ測定が完了するまでは数か月要することもあるため、膨大な社内工数がかかり、当初予定していた開発が十分できないこともあります。自動運転やADAS全体の開発をしている企業であれば自分たちでデータ収集環境を整えることは可能ですが、部分的なソフトウェアを開発する企業にとっては時間と費用が余計にかかってしまいます。

このような自動運転・ADASにおけるソフトウェア開発特有の課題を解決するために、外部のデータセットを活用することができます。これにより、ソフトウェア開発をする企業にとって必ずしも必要のない各種センサーや車両の手配をする業務を省き、本来やりたかった開発作業を明日からすぐに取り組むことができます。

2.データセットを選ぶ上で大切なこととは?

一口にデータセットと言っても、非常に多くの企業が提供しており、自社の開発に適したものを選択することは簡単ではありません。また、近年提供されている無料のデータセットは、情報量が少なく、なかなかうまく活用できないのが現状です。そこで、データセットを選ぶ上で大切になる観点を4つご紹介します。

    1.国内の道路走行データであるかどうか 

日本国内と海外では道路環境が大きく異なります。一般的に提供されている走行データセットは海外のものが多く、そのまま使っても日本の走行環境に対してすぐに適応できるとは限りません。そのため、国内向けの自動運転・ADASにおけるソフトウェア開発をする場合、使用するデータセットが国内のものであることが重要になってきます。

    2.走行データの量が十分あるか 

自動運転やADASに使用するアルゴリズムなどのソフトウェアを開発する上で、参照するデータが多くあることが重要になります。始めから十分な走行時間と走行距離があるデータセットを選ぶことで、途中で手を止めることなく、一貫性をもって開発をすすめることができます。

    3.取得できるデータの種類が豊富か 

データセットの中にどのようなデータが入っているかも非常に重要な観点になります。中には前方のカメラによる映像だけのデータセットから、側方カメラ、3D-LiDAR、IMU、さらには車両の操舵やブレーキなどのCANデータまで入ったデータセットもあります。
多くの場合、様々なセンサーからの情報を組み合わせたシステムを開発することになるため、なるべく多くの種類のデータを取得できるデータセットを選ぶと良いでしょう。
また、カメラの映像しか使わないように思える場合でも、後からこのデータも一緒に欲しかった等の要望を多々受けております。そのため費用にもよりますが、様々な種類のデータを取得しておくことは、決して損になりません。

    4.カメラやセンサーの性能が十分高いか 

自動運転・ADASに使われるカメラやセンサーの性能は日々向上しています。なるべく精度の高いセンサーからのデータをシステム開発に活用することによって、生み出すソフトウェアの幅も広がります。そのため、データセットを選ぶ際は、カメラやセンサーの性能が高いかどうか、という視点に着目することも大事な要素です。

3.首都高全線を収録した「国産走行データセット」とは?

自動運転・ADAS用データセットとして、明日から使える「走行データセット」をご紹介します。本データセットは、ZMPの走行データ取得ソリューションRoboTest®が提供してきた数々のサービスノウハウを詰め込み、首都高全線の高精度な走行データになります。

ZMP走行データセットの特徴

1.
  走行時間15時間以上、国内走行データセット 

首都高速道路全線 (走行時間15時間以上、走行距離約300キロ)の走行データを取得したデータセットであり、日本での自動運転・ADAS開発に嬉しい国内のものとなります。

2.
  車両データや複数のセンサーを同期 

カメラ、LiDAR、GPS、IMU、社内温度、車両CANなど複数データを同期して取得したデータセットです。

3.
  超高精細128レイヤー3D-LiDAR使用 

一般的な32レイヤーのものより、約4倍解像度が高い128レイヤーの3D-LiDARである「RS-Ruby」を採用しています。

4.
 
 データ分析・機械学習に活用可能 

点群データだけではなく、データ処理後の物体検知結果データも提供するため、データ分析や機械学習などにすぐ活用したいお客様に最適なデータセットとなっています。

 首都高全線走行データセットの詳細はこちらから 

まずはご相談を!

ZMPでは、ADAS・自動運転の研究開発をご支援しています。
ご購入をご検討いただいているお客様には無償でサンプルデータの提供が可能です。
アルゴリズム開発やセンサー開発を加速したいお客様は、ぜひお気軽にご相談ください。

自動運転・物流を知る|ZMP編集部

ロボットと人がともに進化する街
「ロボタウン」を徹底解説
自動運転はいつから始まった?
知られざる開発秘話とは
自動運転・ADASに欠かせない
「データ取得」サービス「RoboTest」とは?

ニュース・プレスリリース