Gray's DataHub

Gray's DataHub

2026년 3월 30일1 min read

데이터 엔지니어링, 파이프라인, 그리고 기술 노트를 기록하는 공간입니다.

Projects

Nasdaq Data Pipeline

  • 프로젝트 개요
  • 회고록
  • 1. Kafka Producer
  • 2. Kafka Consumer (Spark Structured Streaming)
  • 3. Airflow (배치처리)
  • 4. Streamlit Dashboard
  • 5. Redis 데이터 관리
  • 6. 성능 테스트 결과
  • Trouble Shooting
    • DuckDB 동시성 문제
    • 단일 DB vs 샤딩
    • Airflow 메모리 문제

DBT Dagster Data Warehousing

    1. dbt + Dagster로 로컬 스타스키마 데이터 마트 구축
    1. dagster_dbt_운영_가이드

Activities

DataTalksClub - Data Engineering Zoomcamp

  • 회고록
  • Week 3-1: Data Warehouse (OLTP vs OLAP)
  • Week 3-2: Data Warehouse (Google BigQuery)
  • Week 4: Analytics Engineering
  • Week 4-1: dbt 실습
  • Week 5: Data Platform (bruin)
  • Week 6: Batch Pipeline (Spark)
  • Week 7: Streaming

Studies

  • Docker Compose로 Kafka 로컬 클러스터 띄우기
  • Kafka
  • Docker
  • Spark
  • Airflow

그래프 뷰

  • Projects
  • Nasdaq Data Pipeline
  • DBT Dagster Data Warehousing
  • Activities
  • DataTalksClub - Data Engineering Zoomcamp
  • Studies

Created with Quartz v4.5.2 © 2026

  • GitHub