개요
STT (음성→텍스트)
회의 회의록, 동영상 자막, 콜센터 통화 분석, 음성 메모 텍스트화, 음성 입력 등에 사용. 다국어 지원, 단어・세그먼트 단위 타임스탬프 반환. 파일 업로드와 스트리밍 모두 지원.
- 엔드포인트
- /v1/audio/transcriptions
- 예시 모델
- stt-large-v3
API
API 예시
curl
curl https://api.openalchemy.io/v1/audio/transcriptions \
-H "Authorization: Bearer $OPENALCHEMY_API_KEY" \
-H "X-Project-Id: $YOUR_PROJECT_ID" \
-F "model=stt-large-v3" \
-F "file=@meeting.m4a" \
-F "response_format=json"상태
할당량 및 요금 (프로젝트별)
할당과 레이트 리밋은 API 키를 발급한 프로젝트에 적용. 도메인 스코프의 정책 레이어가 각 모달리티를 호출할 수 있는 오리진을 추가로 제약.
오늘 시작
추론 비용을 연금술에 가까운 무언가로 바꿀 준비, 됐나요?
무료 플랜으로 프로젝트를 하나 띄우고 첫 1,000건의 요청을 신용카드 없이 실행.