Cloud Dataproc は管理と運用にかかる時間を最短化
従来のオンプレミスの製品や競合するクラウド サービスと比較すると、Cloud Dataproc には 3 個から数百個ノードのクラスタに対応する数々の優れた強みがあります。
- 低コスト: クラスタ上の仮想 CPU の料金はわずか 1 セント/ 時間です。この料金は他に利用されている Cloud Platform のリソースにかかる費用に上乗せされます。そのほか、コンピューティングの費用が安く、さらにコスト削減できるプリエンプティブル インスタンスも利用できます。また、課金の対象となるのは実際に使用した分だけで、使用した時間が最も近い時間数に切り上げられることはありません。課金は分単位で、最低利用時間は 10 分となります。
- 超高速: Dataproc を使用しない場合、オンプレミスもしくは IaaS プロバイダーを通じて Spark/Hadoop クラスタを作成するには 5 ~ 30 分の時間がかかります。一方 Cloud Dataproc クラスタでは迅速な立ち上げ、スケール、シャットダウンが可能でで、それぞれのオペレーションにかかる時間は平均で 90 秒以下です。つまり、クラスタの運用にかかる待ち時間を短縮し、データを活用する時間を拡大できます。
- マネージド サービス: 特別なソフトウェアや管理者の支援なしに、Spark/Hadoop クラスタを使用できます。クラスタや Spark/Hadoop のジョブは、Google デベロッパー コンソール、Google Cloud SDK、Cloud Dataproc REST API を通じて容易に操作できます。使用していないクラスタをオフにすることで、不要なコストを削減することも可能です。Cloud Dataproc は Cloud Storage、BigQuery、Cloud Bigtable と統合されているため、データの喪失について心配する必要もありません。
- シンプルで使いやすい: Cloud Dataproc の利用にあたっては、新しいツールや API について知識を身に付ける必要がありません。既存プロジェクトのCloud Dataproc への移行は、再構築を行うことなく容易に実行できます。Spark、Hadoop、Pig、Hive は頻繁に更新されるため、生産性をすばやく向上させることが可能です。本日のリリースは Spark 1.5 と Hadoop 2.7.1 に対応しています。
Cloud Dataproc は、加速化、堅牢な機能、コストの削減に焦点を置く一連のクラウド技術に加わることになります。Cloud Platform では下記を利用できます。
本日、Google は
Google Cloud Dataproc のベータ提供を開始します。これにより、超高速で単純ながらも強力な Spark と Hadoop のマネージド クラスタをいつでも使用できます。分単位の課金により、実際に使った分だけが支払いの対象となるため、プロセスにかかるコストも削減できます。クリエイティブかつ革新的で生産性の高い
Cloud Dataproc の活用方法をぜひ発見していただければと思います。Cloud Dataproc の詳細については Cloud Dataprocのサイト、もしくは
スタートガイドをご覧ください。また、お問い合わせやフィードバックは
Stack Overflow までお寄せください。
- Posted by James Malone, Product Manager
0 件のコメント :
コメントを投稿