Zenn OpenAI5d ago

音声から文字起こし!tiny〜largeモデルを比較できるローカルでOpenAI Whisperの環境を作ってみた

はじめに 以前の記事では、画像から文字を読み取る OCR 処理についてまとめました。 https://zenn.dev/lecto/articles/b345c7f3920ae9 https://zenn.dev/lecto/articles/b2a42b8fddef49 今回は音声から文字データを起こす方法として、OpenAI の Whisper を使った音声認識(ASR: Automatic Speech Recognition)に挑戦してみました。 Whisper を使った記事は他にもたくさんありますが、この記事では以下のポイントにフォーカスしています: ! この記事のおすすめ...

Like
Save
Read original
Cached
Comments
?

No comments yet

Be the first to comment

AI Curator - Daily AI News Curation

AI Curator

Your AI news assistant

Ask me anything about AI

I can help you understand AI news, trends, and technologies