gcp web_analytics sample schema
GCP의 Web Analytics 샘플 데이터셋은 BigQuery에서 제공되는 Google Analytics 360 샘플 데이터로, 다음 테이블에 존재합니다:
bigquery-public-data.google_analytics_sample.ga_sessions_*
이 데이터는 Google Analytics의 방문 세션(ga_sessions)을 기준으로 구성되어 있으며, **중첩된 구조 (RECORD)**와 **반복 필드 (REPEATED)**를 포함합니다.
🧩 샘플 스키마 요약 (상위 수준)
✅ 기본 필드
| 필드명 | 타입 | 설명 |
|---|---|---|
fullVisitorId |
STRING | 고유 방문자 ID |
visitId |
INTEGER | 세션 ID |
visitNumber |
INTEGER | 방문 순서 (ex: 첫 방문 = 1) |
visitStartTime |
INTEGER | UNIX timestamp |
date |
STRING | YYYYMMDD 형식 날짜 |
✅ RECORD 필드 (중첩 구조)
trafficSource (RECORD)
| 필드명 | 타입 |
|---|---|
| source | STRING |
| medium | STRING |
| campaign | STRING |
| keyword | STRING |
| adContent | STRING |
device (RECORD)
| 필드명 | 타입 |
|---|---|
| browser | STRING |
| operatingSystem | STRING |
| isMobile | BOOLEAN |
| deviceCategory | STRING |
geoNetwork (RECORD)
| 필드명 | 타입 |
|---|---|
| continent | STRING |
| country | STRING |
| city | STRING |
totals (RECORD)
| 필드명 | 타입 |
|---|---|
| visits | INTEGER |
| hits | INTEGER |
| pageviews | INTEGER |
| bounces | INTEGER |
| transactions | INTEGER |
| transactionRevenue | INTEGER |
✅ hits 필드 (REPEATED RECORD)
1개의 세션 내 여러 행동(페이지뷰, 이벤트 등)이 기록됩니다.
| 필드명 | 타입 |
|---|---|
| hitNumber | INTEGER |
| type | STRING |
| time | INTEGER |
| page | RECORD |
| eventInfo | RECORD |
page.pagePath,eventInfo.eventCategory,eventInfo.eventAction등 세부 정보도 존재합니다.
📌 스키마 확인 방법 (BigQuery 콘솔)
- GCP 콘솔 접속: https://console.cloud.google.com/
- BigQuery →
bigquery-public-data.google_analytics_sample→ga_sessions_20170801같은 테이블 선택 - “스키마” 탭 클릭 → 전체 구조 확인 가능
또는 SQL로 일부 필드를 확인:
SELECT fullVisitorId, visitId, totals.pageviews, trafficSource.source
FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801`
LIMIT 10;
필요하다면 이 스키마를 PostgreSQL, DuckDB, JSON Schema 등으로 변환해드릴 수 있어요. 어떤 형식으로 원하시나요?