Looker StudioとBigQueryとは
Looker StudioはGoogleが無料で提供するBI(Business Intelligence)ツールです。
複数のデータソースを容易に可視化し、グラフや表のレポートを素早く生成できるため、データドリブンな意思決定をサポートします。
一方、BigQueryはクラウド上のデータウェアハウスとして、大量の情報をSQL(データを抽出・加工する命令文)で高速かつ安定的に抽出できるのが特長です。
例えば、GA4からサイトのユーザー行動データを連携することで、行動経路の深掘り分析や長期的なデータ蓄積が可能になり、Looker Studioで目的にあわせて可視化できます。
関連記事|
Looker StudioとBigQueryを接続するメリット
Looker StudioとBigQueryを連携することで、アクセス解析や購買データをはじめ、自社が保有するさまざまなデータを効率的に抽出・分析できるようになります。
ここでは、Looker StudioとBigQueryを接続する主なメリット2つを解説します。
大量のデータを安定的に処理できる
大量のデータを安定的に処理できる
BigQueryを活用すれば、大量のデータでもLooker Studioで安定して処理できます。
大量のデータをそのままLooker Studioに読み込ませると、ページ読み込みのたびに抽出処理が入り、表示に時間がかかったりエラーの原因になったりします。
BigQueryで事前に必要なデータを抽出・集計しておけば、Looker Studio側で処理するデータ量が減り、表示速度を大幅に向上できます。
複雑なデータ加工・処理ができる
Looker Studio単体では統合できるデータソースが5つまでと限られますが、BigQueryを併用すればより多くのデータを統合・カスタマイズ可能です。
例えば、サイトの行動データや販売実績など複数ソースをBigQueryのSQLでひとつにまとめ、任意の期間や特定ユーザー層に絞り込んだデータを作成できます。
このように事前に整理されたデータをLooker Studioで読み込むことで、多角的な視点から迅速なデータ分析が可能になります。
Looker StudioとBigQueryを接続する際の注意点
Looker StudioとBigQueryを連携すれば高度なデータ分析が可能になりますが、気を付ける点がいくつかあります。ここでは特に注意すべき2点を解説します。
費用対効果に見合わない場合がある
GA4のローデータはイベントごとに詳細なログが記録されているため、大量のデータを扱うほど、BigQueryのクエリ実行時にスキャンするデータ量が膨大になり、予想以上のコストが発生する可能性があります。
可能であれば、導入前にシミュレーションを実施したり、有識者の意見を聞いたりして、費用対効果が合うかどうかを判断しましょう。
コスト削減には、データの更新頻度を下げる、必要なデータのみに絞って取り込む、一度処理した計算結果を再利用するといった対策が効果的です。
SQLの知識ある人材が必要
BigQueryではデータの抽出・加工にSQLを使うため、専門的なスキルが求められます。
例えば「ページビュー数を集計する」「特定イベントの発生数を調べる」といった基本的な処理でも、SQLを用いたデータ展開・集計作業が必要になります。
SQLに不慣れな担当者が運用するとデータの抽出や加工に苦労し、BigQueryのメリットを十分に活かせません。
そのため、導入前に社内でSQLを扱える人材を確保するか、外部リソースを活用する体制を整えておくとよいでしょう。
GA4×BigQuery×Looker Studio連携のメリット
Looker StudioとBigQueryの連携はさまざまな用途で活用されていますが、中でも特にニーズが高いのがGA4のデータを使った分析です。
ここからは、GA4×BigQuery×Looker Studioの連携によって得られる具体的なメリットを3つ紹介します。
ローデータレベルでの詳細な分析が可能
BigQueryを活用すれば、GA4のローデータ(生データ)をそのまま分析可能です。
GA4の標準レポートは見やすく加工されていますが、その過程でサンプリングやプライバシー保護のためのしきい値が適用され、一部のデータが欠落したり表示されなかったりします。
BigQueryとGA4を連携すれば、これらの制限を受けないローデータを自由に活用でき、詳細で正確な分析が実現します。
GA4のAPI制限を回避できる
サイトへのアクセス数やデータ量が多い場合、GA4の探索レポートやLooker Studioで分析中に「APIの割り当て上限エラー」が発生し、データ取得が途中で止まることがあります。
GA4のデータをBigQueryに連携すると、APIを経由せずにBigQueryから直接Looker Studioにデータを取り込めるため、このような制限が発生しません。
そのため、大量のデータでも安定してレポートを作成・閲覧できます。
14ヶ月以上前のデータを利用可能
GA4(無料版)のデータ保持期間は最長14ヶ月ですが、BigQueryにエクスポートすれば、それ以降もデータを長期的に蓄積できます。ただし、過去(設定前)に遡ってのエクスポートはできないため、できるだけ早く設定することが重要です。
蓄積されたデータを利用することで、前年比較や長期トレンド分析が可能になり、季節性が強いビジネスや長期的なマーケティング施策の分析に役立ちます。
BigQueryとLooker Studioを接続する手順
Looker StudioとBigQueryを接続する手順を紹介します。
今回は、使う機会が特に多いGA4のデータの中から「全期間における日ごとの全イベント発生数」をLooker Studioの表で可視化します。手順は大きく分けて次の3つです。
実際の画面のキャプチャー画像も載せて説明するので、ご自身の画面と見比べながら進めてください。
なお、エクスポート設定した時点以降のデータしか、BigQueryにエクスポートされません。
そのため、可能な限り早めにエクスポート設定することをおすすめします。
手順1.GA4をBigQueryにエクスポートする
GA4をBigQueryにエクスポートする設定を行います。
まずは、GA4の操作をする前に、GCP(Google Cloud Project)のアカウント登録を行いましょう。
まずはGCPの公式サイトにアクセスします。
右上の「無料で利用開始」をクリックしましょう。
国情報を選択し「同意して続行」をクリックします。
本人確認の画面に遷移します。
「新しいお支払プロファイルを作成する」をクリックしましょう。
支払いプロファイルの入力欄が出るので、必要事項を入力し「作成」をクリックします。
次に「お支払い方法を追加」をクリックし、クレジットカードを登録してください。
登録が終わったら「無料で利用開始」をクリックします。
登録が終わると、GCPのトップ画面に切り替わります。これでGCPのアカウント登録は完了です。
次は、BigQueryのAPIを有効化します。
左上のハンバーガーメニュー(三本線)をクリックし、出てきたメニューから「APIとサービス」→「ライブラリ」をクリックしましょう。
検索窓に「bigquery」と入力しエンターキーを押します。
検索結果の中から「BigQuery API」をクリックしましょう。
「有効化」ボタンをクリックしてください。
「APIが有効です」という文言が表示されていれば、有効化できています。
これでGCPの設定は以上です。
この画面は閉じても構いませんが、プロジェクト名はメモを取っておくようにしてください。
以下の画像の赤枠で囲った部分がプロジェクト名です。GA4の設定時に必要になります。
GA4の設定に移ります。
連携したいGA4のプロパティを開き、画面左下の歯車マークをクリックし管理者画面を開きましょう。
「BigQueryのリンク」をクリックしてください。
右上の「リンク」をクリックします。
先ほどメモした、GCPのプロジェクト名を探します。
該当のプロジェクト名の左側にチェックを入れて、右上の「確認」をクリックしましょう。
リンクの設定をしていきます。データのロケーションを選びましょう。
ビジネス要件・法的要件・組織の所在地・分析パフォーマンスなどを考慮して選ぶ必要があります。
今回は「東京」を選びました。「次へ」を押してください。
イベントデータとユーザーデータのエクスポートタイプは「毎日」を選びます。
これを選ぶと、GA4のデータが1日1回BigQueryにエクスポートされます。「次へ」をクリックしましょう。
「送信」をクリックします。
「リンク作成済み」と表示されていれば、GA4からBigQueryへのエクスポート設定は完了です。
BigQueryでGA4のデータが見られるようになるまで、24時間程度は待つことになります。
手順2.BigQuery上でデータを集計する
次に、BigQuery上でGA4のデータを集計します。
BigQueryが取り込んだGA4のデータは膨大なので、そのままLooker Studioに直接読み込むと、大量のデータ処理が発生します。
そこで、BigQuery側で必要なデータをあらかじめ抽出・集計した『中間テーブル』を作成します。
この中間テーブルをLooker Studioのデータソースとして利用することで、処理負荷を抑えることが可能です。
まず、BigQueryの公式サイトを開きます。
左上のプロジェクトが、先ほどつくったプロジェクト名と一致しているかを確かめてください。もしも異なるプロジェクトが選択されている場合は、プロジェクト名をクリックし、該当のプロジェクトを選択しましょう。
SQLでデータを集める前に、データがエクスポートできているかを確認してみます。
以下の画像の赤枠部分を順にクリックしていくと、データのプレビューが表示されます。
画面右側にデータが表示されていれば、GA4のデータがエクスポートできている証拠です。
それでは、このデータに対してSQLを発行して、データを抽出します。
本記事では「イベント名ごとの発生件数を日別に把握」します。
「クエリ」ボタンをクリックして、SQLの編集画面を開いてください。
すでにSQL文が書かれているはずです。
このSQL文はあとで使うので、改行して3行目から書き始めましょう。
次のSQL文をコピーして、3行目に貼り付けてください。
SELECT
event_date,
event_name,
COUNT(*) AS event_count
FROM
`project_id.dataset_id.events_*`
GROUP BY
event_date,
event_name
ORDER BY
event_date,event_count DESC;
FROM句の中の「project_id」と「dataset_id」を1行目を参考に書き換えましょう。
入れ替え終わったら1行目を削除し、次の画像のようになっていれば完成です。
「実行」ボタンを押してみましょう。画面下部に、実行結果が表示されます。
日別のイベント発生数が表示されているはずです。
このデータをLooker Studioに反映させるには「ビュー」として保存する必要があります。
「保存」→「ビューを保存」をクリックしましょう。
ビューの保存に関する設定画面が表示されるので、この表を参考にして設定してみてください。
最後に「保存」ボタンを押します。
左側に今つくったビューが表示されます。
これで、Looker Studioに連携するためのデータがつくれました。
手順3.Looker Studioで図表をつくる
手順2でつくったデータをもとにして「全期間における日ごとの全イベント発生数」をまとめた表をLooker Studioでつくる手順を紹介します。
Looker Studio公式ページにて「作成」をクリックし「レポート」を選びましょう。
データソース一覧の中から「BigQuery」を選びます。
手順2で使ったプロジェクト名とデータセット名を選択し、ビューの名前を選びます。
今回のビュー名は「ga4_events_count_by_date」です。「追加」をクリックします。
そうすると、サンプルとして一つの表がつくられますが、消してしまって構いません。
「グラフを追加」をクリックし「表」を選びます。
その後、画面中央の白い部分で一度左クリックすると、表がつくられます。
画面右側の「グラフ」欄で、この表の内容を変更可能です。
変更できる箇所は他にもありますが、基本的には「ディメンション」と「指標」の箇所を変更すれば、表の内容を変えられます。
データ欄から「event_date」をドラッグし、ディメンションの「event_name」の上にドロップしてみましょう。
そうすると、表の左側に「event_date」の列が挿入されます。
ここから「Record Count」を「event_count」に差し替えます。
「指標」の「Record Count」をクリックし「event_count」を選びましょう。
これで、左から日付、イベント名、イベント発生数が表に揃いました
最後に見た目を整えていきます。
表を選択した状態で、周囲の青い四角形をドラッグすると、表の大きさを変更可能です。
列のヘッダー名がすべて表示されるように大きさを変えておきましょう。
「グラフ」欄を下にスクロールすると「並べ替え」の箇所があります。
すでに入っているディメンションをクリックし「event_date」に変更すると、日付順に並べ変えられます。
この表以外にも、特定のイベント発生数を日別にまとめた表や特定期間での推移を表したグラフも作成可能です。Looker Studioを触って、実際に試してみてください。
BigQueryのコストを抑えるには中間テーブルがおすすめ
BigQueryのコストを抑えるには、中間テーブルを活用するのが効果的です。
中間テーブルとは、分析に必要なデータをあらかじめBigQueryで抽出・集計し、データ量を軽くしたテーブルのことです。
BigQueryはクエリ(データの抽出・集計)のたびにスキャンしたデータ量に応じて料金が発生します。
そのため、GA4の詳細なイベントログ(ローデータ)をそのまま分析すると、数百ギガバイトやテラバイト単位の大量データをスキャンしてしまい、高額なコストがかかる可能性があります。
そこで、事前に日別や週別にデータを整理した中間テーブルを作ることで、スキャンするデータ量を大幅に削減可能です。
前項の「手順2.BigQuery上でデータを集計する」で具体的な方法を紹介していますので、参考にしてください。
まとめ
本記事では、Looker StudioとBigQueryの連携によって実現できるメリットや注意点、具体的な接続手順を解説しました。
GA4をLooker StudioとBigQueryを連携することで、ローデータをそのまま利用した詳細な分析や、長期的なデータ保管など、様々なメリットがあります。しかし、BigQueryの利用にはSQLの知識や費用対効果の見極めが必要です。
そのため、導入前にコストシミュレーションを行い、中間テーブルを作成するなどコスト抑制の工夫も求められます。
パーソルビジネスプロセスデザインでは、GA4×BigQuery×Looker Studioの連携からレポート作成・運用サポートまで幅広く対応しています。
Google Analyticsのスペシャリストが、連携・運用をサポートし、深いデータ分析を実現します。
自社のデータをより効果的に活用したい方はお気軽にお問い合わせください。