アクセス解析担当者のBigQuery日記

普段はアクセス解析やウェブ広告の運用をしています。主にBigQueryについて、記録していきます。

2018-01-01から1年間の記事一覧

BigQuery ML ロジスティック回帰で、次のセッションの注文を予測する

概要 以下のチュートリアルをやってみた。 Getting started with BigQuery ML for data analysts | BigQuery | Google Cloud これを少しアレンジして、 Google Analyticsのデータから、次のセッションでcv(transaction)が発生するか、BigQuery ML のロジステ…

UNNESTせずに特定のページビューやイベントが発生したセッションのみ抽出する

概要 特定の要素を持つ配列全体を、EXISTS句を使って抽出します。 BigQuery Exportのデータなど、構造化されたBigQueryのデータを処理する際、元の構造を保ったまま特定の条件にあった行だけを抽出したいことがあるかと思います。例 特定のページビューが発…

BigQueryで全角英数を半角英数に変換する

以下の流れで処理しています。 TO_CODE_POINTS 関数を使って文字列をコードポイントの配列に変換します。 コードポイント配列をUNNESTします。 コードポイントが全角英数にマッチする場合、対応する半角英数のコードポイントになるようにずらします。 コード…

BigQueryでサイト内検索データや検索語句レポートから、よく使われる単語を抽出する

想定する場面 BigQueryに格納されている、サイト内検索のデータや、Adwordsの検索クエリレポートなどから、よく使われる単語を抽出します。 例えば、 「Big Query run」 「j Query run」 という2行のデータがある時 word count Query 2 run 2 j 1 Big 1 のよ…

サブクエリを使ってサンプルテーブル的なものを簡単に用意する【BigQuery Tips】

想定する場面 何かクエリを試したいけど手頃なテーブルがBigQuery上にない時がたまによくあるかと思います。 必要なデータが少ない場合は、以下の方法でサブクエリにデータを書ききり、テーブル代わりとして扱えるものを用意した方が早いことがあります。 今…

BigQueryでマルチカーソルを使う

想定する場面 例えば、複数のカラムでSUMをとり、カラム名として元のカラム名をそのままつけたい、 ということは、割とよくあると思います。 そういった時に、この機能が使えます。 作業イメージ やり方 今回は、Google Analyticsのサンプルデータセットを使…

このブログについて

書いていること 主にBigQueryについて書きます。たまに他のことも書きます。 chaso-hamaokaのプロフィール 普段はアクセス解析やウェブ広告の運用をしています。たまにPython、javaScript、Unity、Kotlin。