音声認識サービスの精度評価をしたかった その1

公開日:2018-11-25
最終更新:2018-11-29

はじめに / Introduction

  • そろそろ技術面アウトプットしないとまずいなという危機感
  • そろそろ英語でアウトプットしないとまずいなという危機感
  • 新サービスにはとりあえず乗らないとまずいなという危機感

ということで以下、可能な限り日英両方書きたいと思います。
Please teach me some mistakes in my English.

なお、今回のお話はここからいくつかピックアップして言葉としてまとめるだけなので、自分で動かした方が速い方はどうぞ。
具体的な数値比較はもう少し先になります。
というか、未だにPythonがよくわかっていないのでPythonianの方にReviewしてほしい。。。

ja-JP

なんで?

諸般の事情で以下のような音声の文字起こしをする必要がありました。

  • 対象は日本人が話す英語
  • 大体1時間くらいの長さ
  • たまーに日本語が混ざる
  • 録音環境はあまりよくない(周りの音がのってたりする)

お金も時間もかけられないし巷で噂の音声認識APIを叩いてみたかったので、認識自体は外部サービスを使い精度評価だけ自分でやってみることにしました。
比較対象は次のサービスたち。

この時点での私の知識レベルはこんな感じ。

  • AWS: 何度か仕事で軽く触った。IAM、MFAあたりは設定したことあり。
    • GCP、Azureは触ったことはないものの、大体同じことができるんだろうな。
  • Python: if-then-else構文で{}を使わないのが違和感。音声認識やるなら避けられないんだろうなー。

ということで、この後評価方法・そのための実装・数値比較と分けていきます。
開発環境構築で感動した話と各サービスの使い方が微妙に違って困った話は時間があれば。

en-US

Reason

I need to transcribe from voice data to text because of some reasons.
Target voice is like in below bullets.

  • A Japanese speak in English.
  • It is about 60 minutes.
  • Sometimes, he/she talks in Japanese.
  • Recording environment is not so good (including some noise, others' voice etc.).

So, I gave using and evaluating some Speech-to-Text(STT) services to a try because I don't have enough money and time but I want to use some famous STT services.
STT services I used are as follow bullets.

And, I have a little knowledge about some technical words. In detail,

  • AWS: I had been used in my job in several times. I can use now IAM, MFA etc.
    • GCP, Azure: they are very similar service to AWS nevertheless I have never used.
  • Python: I can't avoid to use it for STT but it is quite strange that {} is no use in a whole code.

Anyway, I will separate some chapters and write each topic for example, How to evaluate, Writing codes, and Result. I want to write about Making a developing environment and Difference of how to use STT between abobe services if I have enough time.

次の記事 / Next

https://tmyoas.qrunch.io//entries/Ln0FiC7od2BenAs6

記事が少しでもいいなと思ったらクラップを送ってみよう!
54
+1
@tmyoasの技術ブログ

よく一緒に読まれている記事

0件のコメント

ブログ開設 or ログイン してコメントを送ってみよう
目次をみる

技術ブログをはじめよう

Qrunch(クランチ)は、ITエンジニアリングに携わる全ての人のための技術ブログプラットフォームです。

技術ブログを開設する

Qrunchでアウトプットをはじめよう

Qrunch(クランチ)は、ITエンジニアリングに携わる全ての人のための技術ブログプラットフォームです。

Markdownで書ける

ログ機能でアウトプットを加速

デザインのカスタマイズが可能

技術ブログ開設

ここから先はアカウント(ブログ)開設が必要です

英数字4文字以上
.qrunch.io
英数字6文字以上
ログインする