こんにちは、時系列データプロダクト開発チームです。
今回も「時系列データの本質と時系列データベースを使った取り扱い方にフォーカスしたIoTエンジニア必見の技術情報サイト」として時系列データってそもそも何か?に迫ってみます。
前回に引き続き、時系列データについて紐解いていきます。
前回の記事:「時系列データってなんだ?」
今回は、「時系列データを扱う大変さ」についてお話します。
▶時系列データを扱うのは大変!
時系列データを計測して蓄積し、利用するには非常に手間がかかります。
どういうことか、例え話で理解してみましょう。
部屋をエアコンで暖めることを想像してください。
ここでの時系列データは「電力」と「室温」の2つとしましょう。
人は感覚的に2つのデータの時間的な相関を感じ取れるので、以下のように察することができます。
人の感覚を基準にすると時系列データを扱うことは、そんなに難しくない気がしますね。
では、これを人の感覚ではなく、コンピュータシステムで「電力を消費→室温が上がる」という電力と室温の相関関係を確認するとしましょう。
人の感覚で判断するよりも、定量的で正確な判断ができます。
下の図でその作業を見てみます。
作業が多いですね。数値化、グラフ化までそれなりの時間が必要です。
また、図の「よくある悩み」の通り、それぞれのステップでさまざまな問題に直面しそうです。
それに最後の数値化ができたとしても、1日単位で作業を繰り返す場合は非常に面倒だと感じます。
そうなると、「この作業を自動化できないのか?」という疑問や要望が出てきます。
▶自動化はまだ難しい
現時点では、一気通貫で自動化することは難しいです。
有名なデータ分析プラットフォームの「DataRobot」では、データ分析自動化サービスを提供しています。
こちらのサービスを利用する場合でも、分析に適したデータを前もって準備する必要があり、データ計測・蓄積・管理はサービスから切り離されています。
そして、自社で時系列データを管理するにしても難易度が高いため、自動化はなかなか実現しません。 (「難易度が高い」については、次回以降の記事でお話します。)
弊社製品の時系列データベース「CLOUDSHIP」は個々の時系列データの垣根を取り去って、任意の用途で時系列データを柔軟に扱えるよう管理します。
他のアプリケーションとも連携が可能なため、システムを自動化する一助となるでしょう。
また、「RealBoard」を活用することによって、CLOUDSHIPに蓄積した生のデータを即座に可視化できます。
多様な可視化が可能なため、「必要なデータが問題なく取得できているか」、「取得したデータは果たして仮説通り有益なデータなのか」を早期に判断できます。
詳しく知りたい方は↓
次回は、「時系列データを取り扱うときに意識すべき7つのポイント」について、お話します。
お楽しみに。
Comments