I — Tech
Tech
AI 엔지니어링, 평가 인프라, 한 사람짜리 시스템을 운영하면서 남기는 메모.
I.Entries— newest first6 entries
- 01.2026.04.28Eval-driven 개발: 테스트 대신 스코어보드를 쓰기 시작했나latest회귀 테스트는 결과가 같음을 증명한다. LLM 시스템에서 우리에게 필요한 것은 결과가 더 나아졌다는 증거다.14 min0 views
- 02.2026.04.20RAG에서 reranker 빼고 살아남기reranker가 만들어낸 정확도 환상에서 빠져나오기까지 4주가 걸렸다.9 min0 views
- 03.2026.04.12Claude Code workflow: 2026 봄 정리하루 6시간을 에디터에 앉아 있는 사람의 실측 워크플로우.11 min0 views
- 04.2026.04.05GPU 8장 vs API 콜 — 진짜 손익분기점엑셀로 그려보면 답이 한 줄로 나온다. 다만 그 한 줄이 자주 움직인다.17 min0 views
- 05.2026.03.28Prompt regression suite를 GitHub Actions에서CI에 eval을 붙이는 가장 게으른 방법.8 min0 views
- 06.2026.03.20한 사람이 LLM 기반 SaaS를 운영할 때비용, 모니터링, 그리고 잠.12 min0 views