ks.dgoon.lee log

gemini 기반 번역 백엔드를 gemma4:31b 로 변경


2026/04/14 14:50:28 #dev #google #ai #gemini #AI #llm

4월 8일: 자동 업로드 적용

-> gemini 하루 사용량 약 2만원

4월 10일: 이미지 번역 속도 개선

-> gemini 하루 사용량 약 9만원


Pasted image


4월 12일 DGX Spark 에 Gemma4:31b 기반 번역 서비스 돌리고 Gemini 대체

-> Gemini 사용량 500원으로 감소

Pasted image



하루 평균 8만원 절감이라고 치면, 한달 240만원씩 Gemini API 비용 절감. 여기에 쓰는 DGX Spark 는 590만원이었음 (지금은 훨씬 오름)


세달이면 아낀 토큰비용이 기기비용을 넘어감



기존 번역은 gemini-2.5-flash / gemini-3.0-flash 를 섞어 쓰고 있었음.

여러 컨텐츠들에 대해서 10개 언어에 대해 번역 쭉 돌려서 gemini-3.1-pro 에게 주고 퀄리티를 비교하라고 했는데,


  1. gemma4:26b 의 경우 전반적으로 쓸만하지만 관용구 사용이 어색하거나 고유명사, 숫자 오타가 종종 생김
  2. gemma4:31b 의 경우 gemini-2.5-flash 대비 비슷하거나 더 매끄러운 번역을 보여줌. 26b 에서 생긴 오류들은 거의 없었음.


이정도의 평가여서, 과감하게 gemma4:31b 기반으로 모두 변경.



댓글 0개