gcp web_analytics sample schema
GCP의 Web Analytics 샘플 데이터셋은 BigQuery에서 제공되는 Google Analytics 360 샘플 데이터로, 다음 테이블에 존재합니다:
bigquery-public-data.google_analytics_sample.ga_sessions_*
이 데이터는 Google Analytics의 방문 세션(ga_sessions)을 기준으로 구성되어 있으며, **중첩된 구조 (RECORD)**와 **반복 필드 (REPEATED)**를 포함합니다.
🧩 샘플 스키마 요약 (상위 수준)
✅ 기본 필드
필드명 | 타입 | 설명 |
---|---|---|
fullVisitorId |
STRING | 고유 방문자 ID |
visitId |
INTEGER | 세션 ID |
visitNumber |
INTEGER | 방문 순서 (ex: 첫 방문 = 1) |
visitStartTime |
INTEGER | UNIX timestamp |
date |
STRING | YYYYMMDD 형식 날짜 |
✅ RECORD 필드 (중첩 구조)
trafficSource
(RECORD)
필드명 | 타입 |
---|---|
source | STRING |
medium | STRING |
campaign | STRING |
keyword | STRING |
adContent | STRING |
device
(RECORD)
필드명 | 타입 |
---|---|
browser | STRING |
operatingSystem | STRING |
isMobile | BOOLEAN |
deviceCategory | STRING |
geoNetwork
(RECORD)
필드명 | 타입 |
---|---|
continent | STRING |
country | STRING |
city | STRING |
totals
(RECORD)
필드명 | 타입 |
---|---|
visits | INTEGER |
hits | INTEGER |
pageviews | INTEGER |
bounces | INTEGER |
transactions | INTEGER |
transactionRevenue | INTEGER |
✅ hits
필드 (REPEATED RECORD)
1개의 세션 내 여러 행동(페이지뷰, 이벤트 등)이 기록됩니다.
필드명 | 타입 |
---|---|
hitNumber | INTEGER |
type | STRING |
time | INTEGER |
page | RECORD |
eventInfo | RECORD |
page.pagePath
,eventInfo.eventCategory
,eventInfo.eventAction
등 세부 정보도 존재합니다.
📌 스키마 확인 방법 (BigQuery 콘솔)
- GCP 콘솔 접속: https://console.cloud.google.com/
- BigQuery →
bigquery-public-data.google_analytics_sample
→ga_sessions_20170801
같은 테이블 선택 - “스키마” 탭 클릭 → 전체 구조 확인 가능
또는 SQL로 일부 필드를 확인:
SELECT fullVisitorId, visitId, totals.pageviews, trafficSource.source
FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801`
LIMIT 10;
필요하다면 이 스키마를 PostgreSQL, DuckDB, JSON Schema 등으로 변환해드릴 수 있어요. 어떤 형식으로 원하시나요?