「私たちは非常に早い時期から Beam にかかわっています。(中略)Dataflow モデルがストリームおよびバッチのデータ処理の正しいモデルだということは、私たちの中ですぐに明らかになりました。
1 つのプラットフォームのもとで、リアルタイム アナリティクスとヒストリカル アナリティクスを統一するという Google のビジョンを、私たちは全面的に支持しました。(中略)私たちは、この基礎的な仕事からヒントを得て、Dataflow のホワイトペーパーに書かれていた概念の多くを組み込むために Flink の DataStream API を書き換えました。
Dataflow SDK とランナーが Apache Beam として Apache Incubator に移行することが決まったとき、私たちは Beam のコードベースに Flink ランナーを加えてほしいという要請を Google から受けました。(中略)Beam Model こそ、ストリームおよびバッチの両モードでデータ アプリケーションを作るときのリファレンス プログラミング モデルに相応しいと信じていたので、このチャンスに全力を注ぐことにしたのです。
1 つ疑問があるとすれば、Flink のネイティブ API(DataStream)と Beam API の関係はどうなっているのかということです。(中略)2 つの API の間の違いは主として構文(そして趣味の問題)であり、私たちは Beam と Flink の両 API をソース互換にすることを最終的な目標として、Google との間で API 統一の作業を進めています」
「Google Sheets の柔軟性と BigQuery の地力が結びつき、結果やインサイトをよりスピーディにシェアできるようになった。BigQuery に Google Sheets を直接リンクすることで、使い慣れたインターフェースでデータに新情報を加えることが可能だ。今まで以上に迅速にデータから学べるし、アナリストがどこにいても彼らのデータを取得できる」
require "gcloud" gcloud = Gcloud.new bigquery = gcloud.bigquery sql = "SELECT TOP(word, 50) as word, COUNT(*) as count " + "FROM publicdata:samples.shakespeare" job = bigquery.query_job sql job.wait_until_done! if !job.failed? job.query_results.each do |row| puts row["word"] end end
To debug your job, visit Google Cloud Debugger at: https://console.cloud.google.com/debug?project=<...>&dbgee=<...>
"Flourish".equals(((com.google.cloud.dataflow.sdk.values.KV) c.element()).getKey())
--maxConditionCost
=0.6
ProcessContext