BETA

Mozillaによる音声データベース、Common Voiceについて

投稿日:2018-12-20
最終更新:2019-03-02

はじめに

Webブラウザについてばかり書いていて、我ながら「ちょっとなぁ…」と思い、時々暇つぶしに参加しているMozillaによるオープンな音声データベースについて書こうと思い立ちました。

なお以下は執筆現在の情報ですので、もしかしたら日本語に対応してくれているかもしれません。
そしたらぜひ参加してください!

追記(2019/03/02)

GIGAZINEがCommon Voiceを取り上げた記事を書きました。
詳しくまとめられているのでぜひご一読ください。
Mozillaによる18言語・1361時間にもおよぶパブリックドメインの音声データセット「Common Voice」 - GIGAZINE

Common Voiceとは

Common Voiceプロジェクトは機械が人の話を理解できるようにする、Mozillaの新たな取り組みです。
音声を用いたシステムを開発するには途方もない量の音声データが必要です。
大企業の用いるデータのほとんどは大多数の人々が用いることのできない状況にあります。
イノベーションを阻害していると思しきこの状況を打破するべく、我々は音声認識をオープンで誰でも使えるようにするためのプロジェクトを立ち上げました。
Common Voiceより抜粋

対応言語

  • アイルランド語
  • イタリア語
  • ウェールズ語
  • エストニア語
  • エスペラント語
  • オランダ語
  • カタルーニャ語
  • カビル語
  • キルギス語
  • スロベニア語
  • タタール語
  • チュヴァシ語
  • トルコ語
  • ドイツ語
  • ハーカ・チン語
  • フランス語
  • ブルトン語
  • 中国語 (台湾)
  • 英語

日本語対応は進行中だそうです。残念!

利用方法

ここからデータをダウンロードできます。
申し訳ないのですが、私は使ったことがないのでよくわかりません。
(いつか日本語対応したらPythonでやってみたいな…)。

参加方法

基本的にはアカウント不要で参加(寄付)できます。
ただ、アカウントを作り年齢や性別を指定することでデータと関連付けれられるので、音声認識システムの精度向上に良いらしいです。
また、ランキング機能もあり、競い合ったりすることもできそうです。

このページにアクセスし、『Speak』か『Listen』を選ぶことで、英語で参加できます。
こっちのページからはエスペラントで参加できます(Vizitantoたちよ、頼む!)

Speak

画面に文章が表示されるので、マイクに向かって読み上げるだけです。


かっこいい画面。

キーボードショートカット 操作
r Record/Stop
s Skip

現在、残念ながら日本語には対応していないため、外国語でのスピーキングとなります。
自信のある方はぜひ。

Listen

画面に文章が表示されます。再生ボタンを押し、流れてくる音声がちゃんと文章通りかどうかを判断し、Yes/Noで答えます。

これまたかっこいい画面。

キーボードショートカット 操作
p Play/Stop
y Yes
n No
s Skip

日本語には対応していませんが、スキップもできるので簡単なものだけ選んで参加することも可能です。
(実際、私自身そうしています)。

おわりに

GAFAなどがビッグデータを独占している今、このようなオープンなデータベースをボランティアによって作ろうというのは面白い試みだと思います。
現時点では日本語に対応していないため、日本人ユーザー向けのものの開発では使えないですが、いずれ対応してくれるでしょう!
興味がわきましたら、このページから『参加する』ボタンを押してください!

技術ブログをはじめよう Qrunch(クランチ)は、プログラマの技術アプトプットに特化したブログサービスです
駆け出しエンジニアからエキスパートまで全ての方々のアウトプットを歓迎しております!
or 外部アカウントで 登録 / ログイン する
クランチについてもっと詳しく

この記事が掲載されているブログ

おかゆりぞっとのさほど技術的ではないブログ

よく一緒に読まれる記事

0件のコメント

ブログ開設 or ログイン してコメントを送ってみよう