概要
STT(音声→テキスト)
会議の議事録、動画の字幕、コールセンターの通話解析、ボイスメモのテキスト化、ボイスチャット入力など、音声を文字に変える用途に使う。多言語に対応し、単語・セグメント単位のタイムスタンプを返す。ファイルアップロード/ストリーミング両対応。
- エンドポイント
- /v1/audio/transcriptions
- 例: モデル
- stt-large-v3
API
API サンプル
curl
curl https://api.openalchemy.io/v1/audio/transcriptions \
-H "Authorization: Bearer $OPENALCHEMY_API_KEY" \
-H "X-Project-Id: $YOUR_PROJECT_ID" \
-F "model=stt-large-v3" \
-F "file=@meeting.m4a" \
-F "response_format=json"ステータス
クォータ/料金(プロジェクト粒度)
利用枠とレート制限は API キーを発行したプロジェクトに対して適用される。さらにドメイン単位の細粒度ポリシーで、特定オリジンからの呼び出しを制限できる。
START TODAY
推論コストを、錬金術にかける準備はできていますか。
無料枠で1プロジェクトを作り、最初の1,000リクエストまでクレジットカードなしで動かせる。