(제미나이) Gemini API 요금구조, 무료 사용량과 모델별 가격 정보

2025. 8. 12. 21:29·잡학사전
반응형

Gemini API?

Gemini API는 구글이 제공하는 인공지능 API다. 단순한 챗봇을 넘어서, 텍스트 생성은 물론 이미지 생성, 오디오 처리, 동영상 생성까지 할 수 있다. 사용자가 많고 리소스를 많이 쓰는 만큼 공정한 사용과 시스템 안정성을 유지하려면 제한과 요금이 필요하다.

구글은 크게 두 가지 축에서 사용량을 조절한다. 하나는 비율 제한(Rate Limit)이고, 다른 하나는 유료 요금제(Pricing)다.

이 둘은 독립적이지만 연결돼 있다. 예를 들어, 비율 제한은 무료로도 쓰게 해주는 대신 사용량을 아주 낮게 제한하고, 더 많이 쓰고 싶으면 요금을 내고 등급을 올리라는 식이다.

비율 제한: 내가 얼마만큼 쓸 수 있는가?

비율 제한은 이름 그대로 일정 시간 단위로 요청 가능한 양을 제한한다. 주로 다음 3가지 기준이 있다.

  • RPM (Requests Per Minute): 분당 요청 수
  • TPM (Tokens Per Minute): 분당 처리할 수 있는 토큰 수
  • RPD (Requests Per Day): 하루 최대 요청 수

이 외에도 특정 모델에만 있는 제한이 있다. 예를 들어 이미지 생성은 IPM (Images Per Minute), 음성 모델은 세션 수 제한 등이 있다.
이 제한은 API 키별이 아니라 프로젝트별로 적용된다. 같은 프로젝트에 연결된 키들이 동시에 쓰면 한도도 같이 소모된다.

사용 등급은 어떻게 나뉘나?

Gemini API는 총 4단계의 등급이 있다. 이 등급에 따라 비율 제한과 유료 기능 사용 여부가 갈린다.

등급조건

무료 누구나 사용 가능. 비율 제한 매우 낮음
Tier 1  Google Cloud 결제 계정만 연결하면 됨
Tier 1 누적 결제 $250 이상 + 30일 경과
Tier 3  누적 결제 $1,000 이상 + 30일 경과


등급이 올라갈수록 한도는 넉넉해지고 요금 청구도 가능해진다. 단, 자동 승인은 아니고 구글 측의 검토가 필요하다. 사용 이력이나 이상 징후가 있다면 승인이 거부될 수도 있다.

모델별 비율 제한 상세 비교

Gemini는 모델이 다양하다. 단순 텍스트 생성부터 TTS, 이미지 생성, 오디오 대화까지 모델마다 역할도 요금도 비율 제한도 다르다.

대표 모델 요약 (무료 기준)
모델                                                                                                      RPM                     TPM                          RPD

Gemini 2.5 Pro    5 250,000 100
Gemini 2.5 Flash  10  250,000  250
Gemini 2.5 Flash-Lite  15 250,000 1000
Gemini 2.0 Flash  15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200



이 외에도 이미지 생성 모델이나 오디오 모델, 임베딩 전용 모델도 각각 고유의 한도를 가진다. 일부는 세션 수 기준으로 제한하며, 멀티모달 모델일수록 TPM 수치가 더 크고 복잡하다.

유료 요금 체계: 어떤 모델에 얼마나 드는가?

Gemini API는 토큰 단위 과금 방식을 사용한다. 입력과 출력을 따로 계산하며, 모델에 따라 요율이 다르다.

  • 입력 요금: 프롬프트에 포함된 텍스트, 이미지, 음성 등
  • 출력 요금: 응답에 포함된 모든 결과물
  • 컨텍스트 캐싱 요금: 이전 대화 저장용
  • 스토리지 요금: 토큰 저장
  • Google 검색 그라운딩 요금: 외부 검색 결과를 포함할 때 추가 과금

예시 1: Gemini 2.5 Pro
항목200K 토큰 이하200K 초과
입력 $1.25/백만 토큰 $2.50/백만 토큰
출력 $10.00 $15.00
캐시 $0.31 $0.625

예시 2: Gemini 2.5 Flash
항목요금
입력 (텍스트, 이미지, 동영상) $0.30
입력 (오디오) $1.00
출력 $2.50
캐싱 $0.075 (텍스트/이미지), $0.25 (오디오)

Grounding 요금도 주의

일부 모델은 Google 검색 결과를 활용한 grounding 기능을 제공한다. 최대 무료 RPD 한도 내에서는 공짜지만, 초과하면 1,000건당 $35라는 꽤 높은 요금이 부과된다.

비용 줄이는 팁

  1. Flash-Lite 모델 사용
    성능은 낮지만 비용은 가장 저렴하다
    대규모 처리에 적합
  2. 일괄 모드 활용
    비동기로 처리해서 단가가 절반
    실시간 응답이 필요 없다면 추천
  3. 컨텍스트 캐싱 전략적 활용
    대화 내용을 저장해 다시 활용하면 효율적
    토큰 절약 가능
  4. Grounding은 꼭 필요한 경우만
    무료 한도 내에서만 활용하도록 설정하는 게 좋다


마무리

Gemini API는 멀티모달 AI 플랫폼이다. 그만큼 요금 구조도 복잡하고, 사용 정책도 세분화돼 있다.
다행히도 구글은 무료 등급을 통해 충분한 테스트 환경을 제공하고, 필요에 따라 유료로 유연하게 확장할 수 있는 구조를 갖췄다.

개인적으로 gpt 보다는 사용량이 넉넉하고 요금도 너그러운 편이라 개인 프로젝트에 쓰기 좋은 것 같다.

필요하면 언제든지 요금제 조정 요청도 할 수 있으니, 너무 부담 갖지 말고 써보는 게 좋다. 실사용을 해보는 것만큼 요금 구조를 이해하는 데 좋은 건 없다.

반응형

'잡학사전' 카테고리의 다른 글

구글 애드센스 승인 여려운 이유  (9) 2025.08.17
유니티 개발환경 구축 - 설치 방법과 IDE, C# 설치 여부?  (8) 2025.08.16
GPT5 출시! 무료 사용량 한도 / 변경점 및 개선점  (9) 2025.08.09
Bybit/바이낸스 해킹, 비트코인 해킹/피싱 당하는 이유, 방지 및 대응방법  (5) 2025.08.08
북한 해커 조직 라자루스 (LAZARUS) 정체와 비트코인 해킹, 사이버 공격 사례  (5) 2025.08.07
'잡학사전' 카테고리의 다른 글
  • 구글 애드센스 승인 여려운 이유
  • 유니티 개발환경 구축 - 설치 방법과 IDE, C# 설치 여부?
  • GPT5 출시! 무료 사용량 한도 / 변경점 및 개선점
  • Bybit/바이낸스 해킹, 비트코인 해킹/피싱 당하는 이유, 방지 및 대응방법
CoderCharlie
CoderCharlie
코딩하지뭐
  • CoderCharlie
    코딩하지뭐
    CoderCharlie
  • 인기 글

    • 분류 전체보기 (40) N
      • 잡학사전 (14) N
      • 공구함 (tools & utils) (14)
      • 오류해결 (5)
      • 개발일지 (0)
      • 해킹하지뭐 (Youtube) (3)
      • 잡담 (3) N
  • 태그

    제미나이 api
    구글 서치콘솔 색인생성 자동화
    캘리포니아케이션 게임
    그록 음성모드
    애드센스 승인 어려운 이유
    gpt5 무료한도
    비트코인 해킹
    californication game
    grok 성인모드
    유니티 개발환경 구축
    californication 게임
    애드센스 어려운 이유
    제미나이
    vscode에서 windsurf 사용하기
    gemini api
    gpt5 한도
    grok 성인용 음성모드
    구글 서치콘솔 자동화
    비쥬얼 스튜디오 코드 확장
    유니티 시작하기
  • hELLO· Designed By정상우.v4.10.4
CoderCharlie
(제미나이) Gemini API 요금구조, 무료 사용량과 모델별 가격 정보
상단으로

티스토리툴바