Deep Learningは外国を近くに感じさせてくれる

「AI」と聞くとなんかかっこよさそう、最先端っぽい、という感じがしますが機械学習とかディープラーニングと言われるとあまり聞かないかもしれません。

 

最近では何にでも「AI」をつける傾向がありますが、今回はAIのうち機械学習、その中でもニューラルネットワークを用いたディープラーニングがいかに生活をよりよくするかの例として「DeepL翻訳」をご紹介しながら、AIと機械学習、ディープラーニングとは何かを考えたいと思います。

 

AIの分野は定義づけが確定されておらず、研究者によって異なる見解が示されたりしていますので、あくまでも乱暴にまとめるならこうなるという程度でお読みください。

AIって?

人工知能、漢字四文字にすると更にかっこいい気がしますが、耳にはするけどよくわらない「AI」をまずは定番Wikipediaで調べてみると、

「『計算(computation)』という概念と『コンピュータ(computer)』という道具を用いて『知能』を研究する計算機科学(computer science)の一分野」を指す語
引用元:Wikipedia

とあります。

 

何だかよくわからないですね。次に続く、

「言語の理解や推論、問題解決などの知的行動を人間に代わってコンピューターに行わせる技術」
引用元:Wikipedia

の方がイメージしやすいです。
 

要するに人間が行う「見る」「認識する」「考える」「表現する」という知的動作を、機械に行わせるための技術や研究だと思っておきましょう。

 

機械(が)学習(する)

AIの定義がだいぶ広いですから、そう考えればなんでもかんでも「AI」とつけるのは人の行動を模写しているのであれば間違ってはいないかも知れません。
とは言え、人間は複雑な認識処理をしていますから、そう簡単にできるものではないということはわかります。

 

人間が行う複雑な処理を機械にやらせるためには「人がそうしろと手順を指示する」か「人のように機械が自ら学習して実現する」かの2つのアプローチがあり、当たり前ですが前者では人工知能と呼ぶことはできないでしょう。
となると、AIは「自ら人のように学習し、人のように認知して行動する」ことを目指さなければならず、それを実現するためのものが「機械学習」です。
ある物体をそれであると認識するために、以前はどこを見てどう認識してどれと比べてどう判定するかという手順を人が指示していました。
それを機械自身にやってもらおう、というのが機械学習です。

 

ですが、学習する方法というのは一つではなく、それこそ人の数だけあると言っても過言ではありません。
同じものを認識するのに、AさんとBさんでは認識するための手順も蓄積された経験も異なるのですから。
では世界50億の人口分 x 世界に存在する事象の認識方法 とやるのかと言われると、そんなことをしていたら膨大すぎて考えるのも嫌になります。
そこで機械学習では、可能な限りの学習手順をアルゴリズムとして機械に提供し、そこから機械自身が事象に対してどういった考え方をすれば効率的かを考えさせるようにしたのです。

 

人間も同じですが、経験にないものや見たことも聞いたこともないものを認知することはできません。
でも、初めて見たものでも今までの経験に照らして何であるかを推測することはできます。
それをも機械にやらせる訳ですから、より正確な答えを導き出す学習をさせるためには教材(素材)と学習アルゴリズムをどれだけ多く提供できるかになります。
つまり、大量に意味付けされた教材を元に、あらゆる学習方法を叩き込まれた機械が、一生懸命に試行錯誤を繰り返して推論をより正確なものに近づけるよう努力する、それが機械学習ということになるでしょう。

 

ディープラーニング

ディープラーニングはそういった機械が学習する手法の一つです。
車の絵を見て、「これは車です」という出力に至るまでにどれだけの入出力を繰り返すかによって正確性が担保されていきますが、その回数(思考階層)を増やしたものと考えておいてください。
大量のデータを教え込まれた学習方法で試行錯誤する機械学習の中で、試行錯誤回数を人間のニューラルネットワークになぞらえるくらいに増やして精度を高めていくための方法です。

 

ディープラーニングで翻訳

AIや機械学習、ディープラーニングで最も身近なのは「顔認識」ではないでしょうか。
デジタルカメラでも使われている技術ですし、テレビなどでも色々なアプリが紹介されてしかもぱっと見で面白いですから気を惹かれますよね。
ですのでここは敢えて顔認識を外して翻訳をご紹介したいと思います。

 

Google翻訳もそうですが、言語を正確に読み取り表現するという思考は機械学習の例としてはぴったりなものの一つと言えるでしょう。
今回ご紹介するのはGoogle翻訳ではなく「DeepL翻訳」です。
ドイツ、ケルン市にあるDeepL GmbHが提供する機械翻訳で、使ってみた感じではgoogle翻訳よりも正確です。
日本語→英語ではそもそもその英訳が合っているのかどうかわからないということになりますので、今回はプロジェクト・グーテンベルクより著作権が切れていることが確実な1865年「Alice’s Adventures in Wonderland」から原文を日本語訳にしてみたいと思います。

 

「Alice’s Adventures in Wonderland」を翻訳してみる

原文はこちら。

ALICE was beginning to get very tired of sitting by her sister on the bank, and of having nothing to do.
once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, “and what is the use of a book,” thought Alice, “without pictures or conversations?”

※記号などは置き換えています。

 

DeepL翻訳だとこうなります。

 

Google翻訳ではBankを土手ではなく銀行と訳していますね。

 

DeepLは小説というより作文ぽい文章ではあるものの、これは原文そのものが細切れなのでかなり頑張って表現していると思います。
Google翻訳は完全に辞書で引いた直訳を繋げただけですね。これはまだしもわかりますが、文章によっては何を言っているのかわからないしっちゃかめっちゃかな訳になることもしばしばです。

 

もう一つ、英語だけでは何ですからフランス語もやってみましょう。
再びプロジェクト・グーテンベルクのお世話になりながらギュスターブ・フローベールの「三つの物語」を訳します。

 

「三つの物語」を翻訳してみる

原文はこちら。

Un autre soir, sur la route de Beaumont, elle voulut dépasser un grand chariot de foin qui avançait lentement, et en frôlant les roues elle reconnut Théodore.
Il l’aborda d’un air tranquille, disant qu’il fallait tout pardonner, puisque c’était «la faute de la boisson».

 

まずDeepL翻訳です。フランス語だから合っているのかどうなのか、ニュアンスがどうなのかもわかりませんが、日本語訳だけ見るとおかしな文章ではないですね。

 

Google翻訳になると途端に妙な日本語になります。

なんだかセオドアが怖いです。

 

DeepLとGoogleの翻訳の違いは、前述したようにどれだけ深い(ディープ)階層まで学習しているかの違いで現れています。
この結果を見る限りでは、どうやらDeepLの方がGoogleよりも多く・深く学習しているようです。

機械学習やAIの分野は専門的で、様々な基礎学力をベースにしないと習得することは難しい分野です。
言語としては主にPythonが用いられていますので、まずPythonを学ぼうという方はぜひ無料カウンセリングにお越しください。

無料カウンセリングで相談する