분류 전체보기
-
sqlglot, sqlmesh 오픈소스공부/데이터 2026. 4. 12. 22:26
1. 개요💡SQLGlot과 SQLMesh는 모두 Tobiko Data 팀이 개발한 오픈소스 프로젝트입니다. SQLGlot은 SQL 파싱/트랜스파일의 기반 라이브러리이며, SQLMesh는 SQLGlot을 내부 파싱 엔진으로 채택하여 그 위에 구축된 데이터 변환 프레임워크입니다.두 도구는 서로 다른 추상화 수준에서 동작하지만 밀접하게 연관되어 있습니다. SQLGlot은 SQL 조작의 저수준 라이브러리로 활용되며, SQLMesh는 SQLGlot을 기반으로 고수준의 데이터 파이프라인 관리 기능을 제공합니다.핵심 개요 비교구분SQLGlotSQLMesh유형SQL 파서/트랜스파일러 라이브러리데이터 변환 프레임워크개발사Tobiko Data (Toby Mao 개발)Tobiko DataGitHub Stars약 9,100..
-
[Python] pydantic, mypy, typing의 @runtime_checkable언어/파이썬 & 장고 2026. 4. 12. 22:18
Python의 타입 안전성은 정적 분석(mypy), 런타임 데이터 검증(Pydantic), 구조적 인터페이스 정의(typing.Protocol + @runtime_checkable) 세 축이 서로 역할을 분담하여 완성됩니다. 이 문서는 각 도구의 목적, 사용법, 차이점, 조합 방법을 정리한 것입니다.1. 개요Python은 동적 타입 언어이지만, 3.5 이후 타입 힌트(type hints)가 도입되면서 정적 분석과 런타임 검증을 결합한 강력한 타입 안전성을 구현할 수 있게 되었습니다.이 문서에서 다루는 세 가지 도구는 각각 다음 역할을 담당합니다.도구종류주요 역할typing.Protocol • @runtime_checkable표준 라이브러리구조적 인터페이스 정의 및 런타임 구조 검사mypy정적 분석 도구코..
-
[Python] python dependency_injector, injector 라이브러리언어/파이썬 & 장고 2026. 4. 12. 22:13
1. 개요Python에서 의존성 주입(Dependency Injection, DI)을 구현하기 위한 라이브러리는 다양합니다. 그 중 가장 널리 사용되는 두 라이브러리인 dependency-injector와 injector를 비교하고 정리합니다.의존성 주입(DI)이란, 객체가 필요로 하는 다른 객체(의존성)를 직접 생성하지 않고 외부에서 전달받는 설계 패턴입니다. DI를 사용하면 코드의 결합도를 낮추고, 테스트를 용이하게 하며, 유지보수성을 높일 수 있습니다.항목dependency-injectorinjectorPyPI 패키지명dependency-injectorinjectorGitHub Stars4,800+1,500+최신 버전4.49.0 (2026.03)0.24.0 (2026.01)Python 지원3.8 ~..
-
[Python] pytest, pytest-mock 라이브러리언어/파이썬 & 장고 2026. 4. 12. 22:01
1. 개요pytest와 pytest-mock은 Python 생태계에서 가장 널리 사용되는 테스트 관련 라이브러리입니다. 두 라이브러리는 함께 사용하도록 설계되어 있으며, 단위 테스트(Unit Test)부터 통합 테스트(Integration Test)까지 다양한 테스트 시나리오를 깔끔하게 작성할 수 있도록 도와줍니다.구분pytestpytest-mock역할테스트 프레임워크 (실행, 발견, 보고)모킹(Mocking) 지원 플러그인핵심 개념Fixture, Marker, Parametrizemocker fixture, patch, spy독립 사용가능pytest 의존 필수2. 라이브러리 기능 설명2-1. pytestpytest는 Python의 표준 unittest보다 훨씬 간결하고 강력한 테스트 프레임워크입니다. ..
-
[Python] python-decouple 라이브러리언어/파이썬 & 장고 2026. 4. 12. 21:45
프로젝트별 설정을 동적으로 처리하기 위한 설정 파일 및 환경 변수 관리 라이브러리입니다. 코드와 설정의 엄격한 분리(Strict separation of config from code)를 목표로 합니다.1. 개요python-decouple은 애플리케이션 코드에서 설정값(Configuration)을 분리하여 관리하기 위한 Python 라이브러리입니다.원래 Django 프로젝트를 위해 만들어졌으나, 현재는 모든 Python 프로젝트에서 범용적으로 사용할 수 있는 독립 라이브러리로 발전하였습니다. 핵심 철학은 12-Factor App 방법론의 "Config" 원칙, 즉 코드와 설정은 반드시 분리되어야 한다는 것에 기반합니다.GitHub: https://github.com/HBNetwork/python-deco..
-
BI 도구 정리공부/데이터 2026. 4. 10. 16:28
📊BI(Business Intelligence) 도구는 원시 데이터를 비즈니스 인사이트로 변환하는 소프트웨어입니다. 이 문서는 Holistics 블로그 원문을 바탕으로 최신 리서치를 추가하여, 주요 BI 도구의 특징·장단점·선택 기준·2025년 트렌드를 종합적으로 정리했습니다.SQL BI vs Visual BI vs Self-Service BIBI 도구는 사용자 인터페이스와 대상 사용자에 따라 크게 세 가지 접근 방식으로 구분됩니다.구분SQL BIVisual BISelf-Service BI핵심 접근SQL 쿼리 작성 중심 — 쿼리를 직접 작성하여 데이터 탐색드래그앤드롭 시각화 중심 — GUI로 차트와 대시보드 구성비기술 사용자의 자립 분석 — SQL·코딩 없이 스스로 인사이트 도출주요 사용자SQL 숙련 ..
-
ALB vs NLB 개념, 차이점, 쿠버네티스 연동 정리AWS & GCP 2026. 4. 10. 16:27
1. 개요AWS에는 크게 세 가지 로드밸런서가 있습니다. 이 중 현재 가장 많이 쓰이는 두 가지가 ALB(Application Load Balancer) 와 NLB(Network Load Balancer) 입니다.로드밸런서출시OSI 계층주요 프로토콜CLB (Classic LB)20094 / 7HTTP, HTTPS, TCPALB (Application LB)20167계층 (애플리케이션)HTTP, HTTPS, gRPCNLB (Network LB)20174계층 (전송)TCP, UDP, TLSCLB는 레거시로 신규 사용은 권장되지 않습니다.2. ALB (Application Load Balancer)개념ALB는 OSI 7계층(애플리케이션 계층) 에서 동작하는 로드밸런서입니다. HTTP 요청의 내용(URL 경로,..
-
Apache DataSketches 란공부/데이터 2026. 4. 10. 16:16
0. 개요Apache DataSketches는 확률적 알고리즘(Probabilistic Algorithms) 기반의 스트리밍 데이터 집계 라이브러리입니다. 빅데이터 환경에서 정확한 계산이 수십 분~수 시간 걸리는 고유값 카운팅, 분위수 추정, 빈발 항목 탐지 같은 연산을 수 밀리초에 처리하며, 수학적으로 오차 범위를 보장합니다.2011년 Yahoo 내부 프로젝트로 시작 → 2015년 오픈소스 공개 → 2019년 Apache Software Foundation Top-Level Project 승격.항목내용공식 사이트https://datasketches.apache.org/GitHubhttps://github.com/apache/datasketches-python라이선스Apache License 2.0지원 ..
-
Vector, Fluentd, Logstash, benthos(redpanda connect), bento란?공부 2026. 4. 8. 00:13
0. 개요로그(Log)·메트릭(Metric)·이벤트 데이터 파이프라인 구축 시 가장 많이 사용되는 오픈소스 도구 5종에 대한 심층 비교 분석입니다.도구언어라이선스개발사핵심 특징CNCFVectorRustMPL-2.0Datadog고성능 단일 바이너리, VRL 변환 언어, DAG 파이프라인샌드박스FluentdRuby/CApache 2.0CNCF/Treasure Data통합 로깅 레이어, 700+ 플러그인 생태계졸업(Graduated)LogstashJVM/JRubyApache 2.0 + ElasticElasticELK 스택 핵심, Grok 파싱, 200+ 플러그인❌Redpanda ConnectGoApache 2.0 + RCLRedpanda Data구 Benthos, 스트림 프로세서, Bloblang 변환 언어❌..
-
[Python] 파이썬 프로파일링: 성능 병목 현상 찾는 방법언어/파이썬 & 장고 2026. 4. 7. 23:25
📌 이 문서는 Real Python - Profiling in Python 및 추가 웹 검색을 바탕으로 정리되었습니다.개요소프트웨어 프로파일링이란 실행 중인 프로그램의 다양한 메트릭을 수집·분석하여 성능 병목 지점을 찾는 과정입니다.주요 병목 원인:과도한 메모리 사용비효율적인 CPU 활용부최적의 데이터 배치로 인한 캐시 미스"Make it work, then make it beautiful, then if you really, really have to, make it fast."언제 최적화할 것인가?최적화는 반드시 다음 순서로 진행해야 합니다:Testing — 코드가 올바르게 작동하는지 검증Refactoring — 유지보수성과 파이썬스러움 개선Profiling — 비효율적인 부분 식별 후 최적화⚠️ ..