OpenAlchemyOpenAlchemy
← モダリティ一覧

書き起こし / 字幕 / 議事録

STT(音声→テキスト)

近日提供

音声をテキストに変換する。議事録、字幕、コール解析、ボイス入力に。

概要

STT(音声→テキスト)

会議の議事録、動画の字幕、コールセンターの通話解析、ボイスメモのテキスト化、ボイスチャット入力など、音声を文字に変える用途に使う。多言語に対応し、単語・セグメント単位のタイムスタンプを返す。ファイルアップロード/ストリーミング両対応。

エンドポイント
/v1/audio/transcriptions
例: モデル
stt-large-v3

API

API サンプル

curl
curl https://api.openalchemy.io/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENALCHEMY_API_KEY" \
  -H "X-Project-Id: $YOUR_PROJECT_ID" \
  -F "model=stt-large-v3" \
  -F "file=@meeting.m4a" \
  -F "response_format=json"

ステータス

クォータ/料金(プロジェクト粒度)

利用枠とレート制限は API キーを発行したプロジェクトに対して適用される。さらにドメイン単位の細粒度ポリシーで、特定オリジンからの呼び出しを制限できる。

このモダリティのドキュメントを読む

START TODAY

推論コストを、錬金術にかける準備はできていますか。

無料枠で1プロジェクトを作り、最初の1,000リクエストまでクレジットカードなしで動かせる。