Cloud Dataproc は、スケーラビリティと生産性を高める一方で、コストと複雑度を下げ、Spark と Hadoop を自在に実行できるツールへと変身させます。
低コスト
Spark や
Hadoop を使用するためのコストは低く抑え、実際に使った分だけ料金がかかるようにする、というのが私たち Google の考えです。
Cloud Dataproc では、クラスタ内の 1 つの仮想 CPU を 1 時間使用するときにかかる料金はわずか 1 セントです(使用中の他の Cloud Platform リソースの料金が加算されます)。さらに、料金は 10 分を最低使用時間とする分単位であり、切り上げられた概数ではなく、正確な使用時間に対して課金されます。
スピード
Cloud Dataproc の場合、クラスタの起動や停止に 10 分や 15 分といった時間はかかりません。平均で 90 秒以下です。これは、オンプレミスや IaaS など他のソリューションと比べて 2 倍から 10 倍の速さです。したがって、クラスタが立ち上がるのを待つ時間が短縮され、データに触れることができる時間が長くなります。
管理
Cloud Dataproc は以下の強みを有しており、データ処理で課題となることが多い
スケーラビリティと
生産性という 2 つのニーズに応えます。
簡単
最新環境
Cloud Dataproc は、
Spark と
Hadoop の新しいソフトウェア リリースをサポートするため、新しい
イメージ バージョンによって頻繁にアップデートされます。今回のバージョン 1.0.0 では、Hadoop 2.7.2、Spark 1.6.0、Hive 1.2.1、Pig 0.15.0 をサポートするイメージがリリースされています。
統合
- Posted by James Malone, Product Manager
0 件のコメント :
コメントを投稿