書き起こし／字幕／議事録

STT（音声→テキスト）

近日提供

音声をテキストに変換する。議事録、字幕、コール解析、ボイス入力に。

概要

STT（音声→テキスト）

会議の議事録、動画の字幕、コールセンターの通話解析、ボイスメモのテキスト化、ボイスチャット入力など、音声を文字に変える用途に使う。多言語に対応し、単語・セグメント単位のタイムスタンプを返す。ファイルアップロード／ストリーミング両対応。

エンドポイント: /v1/audio/transcriptions
例: モデル: stt-large-v3

API

API サンプル

curl

curl https://api.openalchemy.io/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENALCHEMY_API_KEY" \
  -H "X-Project-Id: $YOUR_PROJECT_ID" \
  -F "model=stt-large-v3" \
  -F "file=@meeting.m4a" \
  -F "response_format=json"

ステータス

クォータ／料金（プロジェクト粒度）

利用枠とレート制限は API キーを発行したプロジェクトに対して適用される。さらにドメイン単位の細粒度ポリシーで、特定オリジンからの呼び出しを制限できる。

このモダリティのドキュメントを読む →

START TODAY

推論コストを、錬金術にかける準備はできていますか。

無料枠で1プロジェクトを作り、最初の1,000リクエストまでクレジットカードなしで動かせる。

無料で始める料金プランを見る