2018-01-01から1年間の記事一覧
概要 以下のチュートリアルをやってみた。 Getting started with BigQuery ML for data analysts | BigQuery | Google Cloud これを少しアレンジして、 Google Analyticsのデータから、次のセッションでcv(transaction)が発生するか、BigQuery ML のロジステ…
概要 特定の要素を持つ配列全体を、EXISTS句を使って抽出します。 BigQuery Exportのデータなど、構造化されたBigQueryのデータを処理する際、元の構造を保ったまま特定の条件にあった行だけを抽出したいことがあるかと思います。例 特定のページビューが発…
以下の流れで処理しています。 TO_CODE_POINTS 関数を使って文字列をコードポイントの配列に変換します。 コードポイント配列をUNNESTします。 コードポイントが全角英数にマッチする場合、対応する半角英数のコードポイントになるようにずらします。 コード…
想定する場面 BigQueryに格納されている、サイト内検索のデータや、Adwordsの検索クエリレポートなどから、よく使われる単語を抽出します。 例えば、 「Big Query run」 「j Query run」 という2行のデータがある時 word count Query 2 run 2 j 1 Big 1 のよ…
想定する場面 何かクエリを試したいけど手頃なテーブルがBigQuery上にない時がたまによくあるかと思います。 必要なデータが少ない場合は、以下の方法でサブクエリにデータを書ききり、テーブル代わりとして扱えるものを用意した方が早いことがあります。 今…
想定する場面 例えば、複数のカラムでSUMをとり、カラム名として元のカラム名をそのままつけたい、 ということは、割とよくあると思います。 そういった時に、この機能が使えます。 作業イメージ やり方 今回は、Google Analyticsのサンプルデータセットを使…
書いていること 主にBigQueryについて書きます。たまに他のことも書きます。 chaso-hamaokaのプロフィール 普段はアクセス解析やウェブ広告の運用をしています。たまにPython、javaScript、Unity、Kotlin。