Things I’m building
하드웨어/소프트웨어 경계에서 작업 중인 프로젝트들입니다.
- pccxactive
Edge FPGA용 병렬 컴퓨팅 코어 프레임워크: 커스텀 ISA, INT8 시스톨릭 어레이, 런타임 큐, Python 드라이버 스택.
why it matters · LLM 추론 과정에서 MAC 연산량 외에도 메모리 이동, 커널 형태, 드라이버 오버헤드가 어떤 영향을 주는지 연구하기 위해 만들었습니다.
- pccx-labactive
pccx NPU를 위한 시각적 성능 프로파일러 겸 pre-RTL 시뮬레이터.
why it matters · 하드웨어를 디버깅하려면 좋은 소프트웨어 도구가 필요합니다. Verilog 파형과 고수준 실행 그래프 사이의 간극을 메우기 위한 도구입니다.
- llm-bottleneck-labactive
Python 런타임과 C++ 커널, KV-cache 실험을 포함하는 경량 LLM 서빙 스택.
why it matters · 최적화 아이디어를 FPGA 커널로 내리기 전에 소프트웨어 베이스라인을 빠르게 검증하기 위해 사용합니다.
- NPU-FPGA-Transformer-Accelerator-KV260wip
AMD Kria KV260 기반 Transformer 추론 IP. 시스톨릭 GEMM과 Attention, Normalization을 위한 특수 연산 유닛을 포함합니다.
why it matters · 단순한 모델 가속을 넘어 메모리 계층 구조, 스케줄링, 런타임 설계의 중요성을 깨닫게 해준 프로젝트입니다.
- driver-drowsiness-detectionarchived
얼굴 랜드마크와 경량 모델을 활용한 학부 시절 컴퓨터 비전 지연시간 최적화 프로젝트.
why it matters · 단순한 벤치마크 정확도보다 엔드투엔드 레이턴시에 더 신경 쓰게 된 첫 번째 프로젝트입니다.