1 / 8
배경
모차르티아데 사이트의 작품 카탈로그가 늘어날수록 한 가지 걱정이 함께 자랐습니다. 처음 시드할 때는 위키피디아·IMSLP·쾨헬 목록을 꼼꼼히 대조해 작곡연도, 악기 편성, 악장 제목을 확인해 넣지만, 그 정보가 시간이 지나도 정확한지 누가 다시 봐 줄까. 학술 자료가 갱신되거나 표기가 표준화되거나, 단순히 처음 시드 때 잘못 적힌 숫자가 그대로 남아있을 수도 있습니다. 갯수가 적을 때는 사람이 한 번씩 훑었지만 작품이 100개를 넘어가면서부터는 손을 놓고 있었습니다. 이미 매일 아침 6시에 외부 클래식 매체 12곳을 훑어 모차르트 뉴스를 한국어로 옮기는 mozart-news-daily-ingest 루틴이 운영되고 있었습니다. 그 패턴 — Claude Routines가 클라우드에서 정해진 시간에 깨어나 일하고 슬랙으로 결과를 보고하는 — 을 콘텐츠 자정에도 그대로 적용할 수 있겠다는 생각이 들었습니다. 다만 방향이 반대입니다. news 루틴이 외부 콘텐츠를 DB에 적재한다면, 이번 루틴은 DB 콘텐츠를 외부 사실로 다시 검증합니다. 그래서 mozart-quality-watch 루틴을 만들었습니다. 매일 한 작품씩, 가장 오래 손을 안 댄 작품부터 골라 외부 1차 출처와 대조하고, 안전한 텍스트 필드의 차이만 자동으로 메우고, 손대면 위험한 영역(특히 YouTube URL과 악장 구조)은 절대 건드리지 않으며 운영자에게 슬랙으로 보고합니다. 콘텐츠가 늘어나도 품질이 유지되도록 하는 자정(自淨) 메커니즘입니다.
Mozartiade Team
2026년 4월 30일 · 15분 읽기
외부 출처와 DB 콘텐츠를 매일 한 작품씩 교차 검증해 사실 차이를 자동으로 메우는 mozart-quality-watch 루틴 설계기