받아쓰기 · 자막 · 회의록

STT (음성→텍스트)

Soon

음성을 텍스트로 변환 — 회의록, 자막, 통화 분석, 음성 입력에.

개요

STT (음성→텍스트)

회의 회의록, 동영상 자막, 콜센터 통화 분석, 음성 메모 텍스트화, 음성 입력 등에 사용. 다국어 지원, 단어・세그먼트 단위 타임스탬프 반환. 파일 업로드와 스트리밍 모두 지원.

엔드포인트: /v1/audio/transcriptions
예시 모델: stt-large-v3

API

API 예시

curl

curl https://api.openalchemy.io/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENALCHEMY_API_KEY" \
  -H "X-Project-Id: $YOUR_PROJECT_ID" \
  -F "model=stt-large-v3" \
  -F "file=@meeting.m4a" \
  -F "response_format=json"

상태

할당량 및 요금 (프로젝트별)

할당과 레이트 리밋은 API 키를 발급한 프로젝트에 적용. 도메인 스코프의 정책 레이어가 각 모달리티를 호출할 수 있는 오리진을 추가로 제약.

이 모달리티의 문서 보기 →

오늘 시작

추론 비용을 연금술에 가까운 무언가로 바꿀 준비, 됐나요?

무료 플랜으로 프로젝트를 하나 띄우고 첫 1,000건의 요청을 신용카드 없이 실행.

무료 시작 요금 보기